• 我的订阅
  • 头条热搜
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
科学家竞相破解大型语言模型背后的谜团
...技日报ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团图片来源:视觉中国【科技创新世界潮】◎本报记者 刘 霞北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
强化物理观念 考查创新思维
...动汽车的动力回收原理为背景,引导学生运用简单的物理模型理解生产实践中的高新技术,建立起用物理知识理解现实生活的桥梁;全国甲卷第20题将物理知识与“蹦床”运动紧密结合,激发学生参与体育运动的热情,引导学生...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
华东师范大学的老师,上课已经用上了大模型
...众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不会问哪里):讲解一下des加密算法。想要做题来巩固知识点?不用再搜往期试卷了。直接跟大模型说...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...理的增长将远大于训练的增长;闭源和开源将共存,开源模型可能用于创建特定领域的应用程序;……(以下为重点部分整理) Q:关于个人AI助理的发展前景,您认为我们何时能在口袋里装上一个无所不知的AI助理?A:很快就...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
更多关于科技的资讯:
网友票选年度最佳手机:iPhone罕见跌出Top 4!
快科技12月22日消息,在Android Authority近期的年度最佳手机票选中,三星Galaxy S24 Ultra经过两轮激烈竞争后脱颖而出
2024-12-22 14:02:00
鸿蒙智行泊车代驾VPD正式开启全量推送!升级自动泊车/接驾等多项功能
快科技12月22日消息,鸿蒙智行近日宣布全面推送泊车代驾VPD功能,该功能基于华为ADS 3.0技术,带来了多项创新。据悉
2024-12-22 14:02:00
全球第三大车企要诞生了 本田与日产明天启动合并磋商
快科技12月22日消息,据报道,本田和日产汽车23日起将正式启动经营合并磋商,三菱汽车则在协调于明年年初决定是否参与合并
2024-12-22 14:32:00
威刚XPG动境机箱首发199元:独特洞洞板设计
快科技12月22日消息,威刚推出了XPG动境机箱,该机箱以经典的黑、白两色呈现,预售价299元,而首发期间199元。XPG动境机箱的最大亮点
2024-12-22 14:32:00
三星没放弃曲面屏开发!最新专利曝光暗示有望回归
快科技12月22日消息,近年来曲面屏在Android市场中逐渐失宠,三星作为曲面屏幕手机的先驱,连自家旗舰S24 Ultra也放弃了曲面设计
2024-12-22 14:32:00
不许说日语的App在日本爆火:必须用“伪中国语”聊天 日本人和中国人都能看懂
快科技12月22日消息,近日,“伪中国语”在日本网络上翻红。一款名为“对多”(推特的谐音)的App在12月18日更新上线后
2024-12-22 14:32:00
李斌回应蔚来ET9定价78.8万起:很合理 有朋友说不要低于80万
快科技12月22日消息,在媒体沟通会上,蔚来创始人、董事长李斌回应了蔚来新旗舰车型ET9的定价逻辑。他表示,市场定价本身也是一种定位
2024-12-22 15:02:00
最新研究!AI污染可导致美国60万人得哮喘 1300名患者早亡
快科技12月22日消息,据某学术平台报道,近日,一项重要研究发现,至2030年,支持人工智能(AI)所需的电力可能会给美国带来严重的公共卫生问题
2024-12-22 15:02:00
60度电池跑出100度续航!特斯拉电耗水平全球第一 雷军承认小米需要3-5年学习
快科技12月22日消息,特斯拉公司副总裁陶琳今日发文称,特斯拉车型能耗表现出众,可以用60度跑出100度电池的效果。她强调
2024-12-22 15:32:00
限时13.59万起!领克纯电紧凑型SUV——Z20正式上市
快科技12月22日消息,领克Z20,基于SEA浩瀚架构打造的纯电紧凑型SUV正式上市。据悉,共推出三款车型,官方指导价区间为13
2024-12-22 15:32:00
雷军周末开小米SU7 Ultra跑山:戴墨镜、穿风衣 网友直呼太帅
快科技12月22日消息,今日雷军在微博晒出一组和小米SU7 Ultra的合影。照片中,雷军戴墨镜、穿风衣,站在小米SU7 Ultra车前
2024-12-22 16:02:00
《森林》迎来历史新低,steam国区原价70元
12月20日消息,多人联机生存游戏《森林(TheForest)》昨日迎来了新的历史最低价,Steam国区原价70元,立减90%后售价7
2024-12-22 16:58:00
全球覆盖规模最广!高德地图携手蔚来发布全域车道级导航:ET9首搭
快科技12月22日消息,高德地图与蔚来汽车合作,在蔚来NIO DAY上宣布推出全域车道级导航服务,首发搭载于蔚来ET9车型
2024-12-22 17:02:00
奇瑞旗下星途星纪元公布OS 1.4.0版本OTA内容
12月20日消息,奇瑞旗下星途星纪元今日公布OS1.4.0版本OTA内容,80+项新增与优化功能,近期OTA陆续推送中
2024-12-22 17:04:00
飞牛私有云发布fd5硬盘柜,5盘位设计
12月20日消息,飞牛私有云今日发布了FD5硬盘柜,定价850元。官方表示,这款硬盘柜主要为装有飞牛系统的小主机NAS用户设计
2024-12-22 17:08:00