• 我的订阅
  • 头条热搜
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...测试的原始迭代没有考虑效率,因为 vanilla LLM 生成某些输出所花费的时间仅取决于该输出的长度,而与实例的语义内容或难度无关。不过作者也对各个模型的提示成本进行了比较,如表格 4 所示。 从近似检索到近似推理:评估...……更多
AI新时代揭幕!会“思考解题逻辑”的OpenAI推理大模型登场
...手写代码前,把整个回答的流程全部思考完一遍,再动手输出代码。 例如在预设条件的写诗任务(例如第二句的最后一个单词需要以i收尾)中,“拿起笔就写”的GPT-4o的确给出了回答,但往往只会满足了一部分条件,同时不会...……更多
谷歌之后,OpenAI也要给新闻网站付费了?
...,第一是训练AI模型时有没有用到我的版权内容;第二是输出的文字、图片、音视频内容有没有涉及侵权的地方。大模型商业化必然要面临“版权”问题,以OpenAI最新发布的GPT-4o为例,该大模型能够处理50种不同的语言,相比过...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...架会持续观察和记录结果,必要时进行调整和优化,最终输出经过验证的研究成果。这种自动化流程显著提升了研究效率,确保了实验的可执行性和结果的可靠性。 在 MLR-Copilot 框架中,整个科研流程分为三个阶段:1. 研究思路...……更多
...讲中表示,大模型技术已在各种领域中初步应用,但存在输出结果可信性不足、稳定性不强的问题,其安全性也面临挑战,对其应用的可靠性造成一定影响,应着力提高大模型的准确性、有效性与实用性。上海交通大学特聘教授...……更多
...并写出摘要”等指令,几秒钟内,“商量”便有条不紊地输出相关内容,包括每章节的名字、大纲概要,对内容的总结理解等。记者粗略浏览了一页,“商量”撰写的内容言简意赅,内容排版清晰,用户在阅读时能够准确及时找...……更多
自动化、可复现,基于大语言模型群体智能的多维评估基准
...受欢迎的基准测试是 Chatbot Arena,它通过收集用户对模型输出的偏好来对 LLM 进行综合排名。然而,随着 LLM 逐渐落地于众多应用场景,无论是针对工业生产目标,还是科学场景辅助需求,评估 LLM 在精细化维度上的能力都是至关...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
...,以及 Crescendo 生成的多轮提问是否安全。Llama Guard 2 会输出提问为不安全的概率。实验结果显示,ActorAttack 生成的多轮提问的毒性比直接提问和 Cresendo 的多轮提问更低,揭示了其攻击的隐蔽性。第一个多轮对话场景下的安全对...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...检测是防止深度网络模型遭遇分布偏移数据时产生不可控输出的重要手段,它对模型在现实世界中的部署安全起到了关键的作用。随着语言模型的发展,复杂生成序列的错误传播会使得 OOD 数据带来的负面影响更加严重,因此语...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...腾讯混元大模型却基于自身的技术能力,保证正确答案的输出。 与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开...……更多
专访微软AI CEO:没有 OpenAI,我们也能训练出世界上最好的模型
...统注定会重复它们所接受的训练数据”。查询训练数据和输出结果之间存在某种一对一的映射关系。如今很明显,它们实际上并没有这么做。对训练数据的多个 N 维元素之间的空间进行插值,这本身就是一个创造性的过程,对吗...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
...块执行。4、结果整合:汇总各子任务的结果,形成最终输出,并反馈给用户。基于上述框架,咱们接着看整个系统架构,DS Assistant整套系统有4个主要模块。 先说右侧的DS Assistant,它作为整个系统的大脑,负责调度整个系统的...……更多
仅用4块GPU、不到3天训练出开源版GPT-4o,这是国内团队最新研究
...仅支持基于文本的交互,这限制了它们在不适合文本输入输出的场景中的应用。GPT-4o 的出现使得通过语音与 LLM 进行交互成为可能。然而,开源社区对于构建此类基于 LLM 的语音交互模型仍然缺乏探索。实现与 LLM 进行语音交互...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
... Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预训练从庞大的训练数据集中学习。但是...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...有多模态大模型结合。比如,驾驶员注意力机制可以实时输出,让乘客实时观察当前大模型所认为权重较大的板块。如果乘客认为不合理,可以语音告诉端到端模型,从而实现自动调节,进而实现持续学习和不断优化。 端到端...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...果。7、Meta 更新了许可证,允许开发者使用 Llama 模型的输出结果来增强其他模型。在这篇论文的最后,我们还看到了长长的贡献者名单:这一系列因素,最终造就了今天的 Llama 3 系列。当然,对于普通开发者来说,如何利用 405B...……更多
...海量信息里发掘潜在规律,从而更好的预测下一个token的输出。这使得大模型即使面对它不曾见过的情景,或者没有见过的问题,也能进行作答,仿若人类思考和学习的方式。02大模型即操作系统每个时代都有自己的操作系统,...……更多
谷歌开源最强端侧小模型:2B参数越级跑赢GPT-3.5-Turbo
...; ShieldGemma 基于 Gemma 2 构建,用于过滤 AI 模型的输入和输出,确保用户安全; Gemma Scope 提供对模型内部工作原理的无与伦比的洞察力。其中,Gemma 2 2B 无疑是「最耀眼的仔」,它在大模型竞技场 LMSYS Chatbot Arena 中的结果令人眼……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...更重要的领域得到应用,证明为什么我们可以信任它们的输出,并明确何时不应信任它们,变得越来越重要。获得对复杂系统输出结果信任的一个可行方法是,要求系统对其输出产生一种解释,这种解释对人类或另一个受信任的...……更多
2024WAIC热议大模型助力产业新趋势,可信应用成焦点
...场景的需求;第二,鉴于 Transformer 注意力机制作为概率输出模型,天生具有不可控的机理,AI 须具备可预测和稳定的性能;第三,面对大模型可能产生的信息幻觉,确保内容的准确性和真实性是一大挑战;最后,必须包括内容...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...与人类的意图相对齐、研究如何通过不同对齐算法让模型输出更符合人类预期和价值观具有重要意义。该框架的独特之处在于:1)Align-Anything 框架支持文本、图像、音频、视频等多种模态的输入和输出对齐,这在目前开源社区...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...知系统运行,比如通过一系列的神经网络层,并产生一个输出的过程。 对于任何一个单一输入,通常只有一个输出,但在很多情况下,对于一个感知输入,可能存在多种可能的输出解释。你需要的是不仅仅计算单一函数,而是...……更多
超越YOLOv10/11、RT-DETRv2/3!D-FINE重新定义边界框回归任务
...。此外,D-FINE 将定位知识 (Localization Knowledge) 融入到模型输出,通过高效的自蒸馏策略在各层共享这些知识,因而在不增加额外训练成本的前提下,实现了性能的进一步显著提升。 论文标题: D-FINE: Redefine Regression Task of DE……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...用门槛,让大模型变得更为“实用”,腾讯开始加快对外输出大模型能力的脚步。如腾讯混元发布了智能体平台“腾讯元器”,帮助用户以极低的门槛创建专属AI智能体,并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
...模型开发的预训练阶段引入了 Llama 3.1 的 8B 和 70B 模型的输出,用作训练过程中的 token 级目标。在 post-training 阶段,Meta 采用了与 Llama 3.1 相似的方法 —— 在预训练模型的基础上进行多轮对齐,其中每一轮都包括监督式微调(SFT...……更多
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
...出了一个两次重加权框架,分别对草稿模型和目标模型的输出分布进行重加权。这个框架具有很高的自由度,两次重加权函数可以不同,验证算法也可以任意选择,只要满足最终算法保持输出概率分布,从而维持输出质量即可。...……更多
创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
...并配合语言指令进行下一步动作的预测。与以 token 形式输出文本内容的大语言模型不同,在 VLA 模型中,算法需要实时处理视觉环境中的动作,快速准确地面对外界做出连续的动作反应。创新奇智的机器人可以保持一秒钟 30Hz 的...……更多
...索”“公式召回”“代码生成”“编译计算”等环节,可输出最终的正确答案。金融事件分析方面,具有多轮高质量金融相关对话、思维导图生成、问题推荐等功能。 ……更多
Sora “拯救”元宇宙,世界模型的潜力才刚释放
...说,Sora 的最大贡献是作为革命性平台,极大降低了视频输出成本。这被一度看作是元宇宙发展的核心桎梏。表面上,它的出现冲击了贴片广告、影视或严肃新闻的禁脔。深层次而言,它更是可以改变教育、文旅和会展等诸多行...……更多
1-bit大模型还能再突破!新一代BitNet架构启用4位激活值
...类似高斯分布,而在FFN下采样之前的激活值和注意力中的输出投影中,发现了很多异常值通道和大量接近零的条目(全精度LLM也有类似观察结果)。如图3所示,直接将低位量化应用于这些中间状态会引入很大的量化误差。因此...……更多
更多关于科技的资讯:
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00
阿里巴巴承办COP30中国角边会 展示AI驱动气候治理新成果
第30届联合国气候变化大会(COP30)于11月10日至21日在巴西帕拉州首府贝伦市举办,这是2015年《巴黎协定》签署以来最受瞩目的气候大会
2025-11-21 11:36:00
数绘星云与腾讯云达成战略合作,共同推动AI出海电商智能化升级
11月18日,数绘星云(深圳)科技有限责任公司与腾讯云正式签订战略合作协议,双方将在云计算、大数据、AIGC等核心领域开展深度合作
2025-11-21 11:48:00
中新经纬11月21日电 据彭博社报道,当地时间20日,谷歌宣布了一款名为Nano Banana Pro的新型图像生成和编辑模型
2025-11-21 11:53:00
回望“十四五”,西安交通大学方涛教授说,他们团队倍感振奋。“在国家能源结构转型关键期,我们扎根国家‘双碳’战略,依托西安交大强大科研平台
2025-11-21 13:29:00
舒朗秋11月19日,工业和信息化部举行新闻发布会,介绍GB6675《玩具安全》系列强制性国家标准修订情况。据介绍,我国建成了全球最为完善的玩具产业链
2025-11-21 14:19:00
向长河英国剑桥大学出版社近日宣布,与追星相关的词语“准社交”(parasocial)成为2025年《剑桥词典》年度词汇
2025-11-21 14:19:00
2025世界计算大会发布全球计算十大创新成就
20日,2025世界计算大会在湖南长沙开幕。大会发布了2025全球计算十大创新成就及2026十大发展趋势。此次发布的全球计算十大创新成就包括
2025-11-21 15:35:00
系统创业 自由人生|首届雨大王大健康私域 IP 创业峰会在深圆满落幕
2025年11月1日-2日,为期两天一夜的首届雨大王大健康私域IP创业峰会在深圳成功举办。本次峰会以"系统创业,自由人生"为主题
2025-11-21 15:41:00
《保险AI智能体应用白皮书》发布,四层架构+七大场景定义行业智能新范式
随着人工智能技术加速重塑千行百业,以AI智能体为代表的AI技术正成为推动产业智能化转型的核心引擎。在保险行业,伴随数字化进程的深入推进
2025-11-21 15:42:00