• 我的订阅
  • 头条热搜
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
科学家竞相破解大型语言模型背后的谜团
...技日报ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团图片来源:视觉中国【科技创新世界潮】◎本报记者 刘 霞北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
强化物理观念 考查创新思维
...动汽车的动力回收原理为背景,引导学生运用简单的物理模型理解生产实践中的高新技术,建立起用物理知识理解现实生活的桥梁;全国甲卷第20题将物理知识与“蹦床”运动紧密结合,激发学生参与体育运动的热情,引导学生...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
华东师范大学的老师,上课已经用上了大模型
...众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不会问哪里):讲解一下des加密算法。想要做题来巩固知识点?不用再搜往期试卷了。直接跟大模型说...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...理的增长将远大于训练的增长;闭源和开源将共存,开源模型可能用于创建特定领域的应用程序;……(以下为重点部分整理) Q:关于个人AI助理的发展前景,您认为我们何时能在口袋里装上一个无所不知的AI助理?A:很快就...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
名师点评河南高考物理|郑州市第十一中学穆长林:强化物理观念、实验考查
...以电动汽车的动力回收为情境,引导学生运用简单的物理模型理解生产实践中的高新技术。 新课标卷第21题介绍四冲程柴油机上的狄塞尔循环的主要过程,考查学生对循环过程中能量守恒和转换的理解;全国甲卷第20题将物理知...……更多
更多关于科技的资讯:
人人都买得起!华为折叠屏新品前瞻:价格真香预警
随着智能手机的不断进化,折叠屏技术逐渐从高端奢华的象征变成了普通消费者眼中的“理想之物”。近日,我们终于迎来了一个令人兴奋的消息
2025-03-12 19:50:00
为全面屏扫清最大障碍!苹果屏下Face ID已在路上:期待已久
大家都知道目前苹果的产品线中还未有出现折叠屏产品,虽然很久之前就有传言称苹果会在2024年推出可折叠iPad,而且这款可折叠iPad是配备了碳纤维材质的支撑架
2025-03-12 20:20:00
曝京东算法全员将进行30%普调涨薪:全部门覆盖
快科技3月12日消息,据国内媒体报道,近期不少爆料提到,京东全体算法岗喜提30%普调涨薪,覆盖范围包括广告部、搜推部、算法交易部等集团各个部门
2025-03-12 20:20:00
下载榜第一的AI应用:腾讯元宝电脑版更新 支持大字体、拖拽上传
快科技3月12日消息,腾讯元宝今天官宣电脑版发布1.3.0更新,带来两大新功能:大字体、拖拽上传。现在电脑元宝可以随心调节字体大小了
2025-03-12 20:20:00
99元小米SU7 Ultra开拍:两人疯抢 已竞拍到51万元
快科技3月12日消息,今天阿里拍卖上,一辆小米SU7 Ultra开拍,引发近3万人围观。这辆小米SU7 Ultra保证金15000才能参与拍卖
2025-03-12 20:50:00
联想官方发文:我们没有996、准时下班在联想不是新鲜事
快科技3月12日消息,在国内多家大厂开始实行“强制下班”时,联想今天发布推文表示“大厂反内卷文化看联想集团”。联想表示
2025-03-12 20:50:00
价值49元 《王者荣耀》又免费送皮肤了
快科技3月12日消息,《王者荣耀》明天又免费送皮肤了,这次是送刘备-浪漫序章。活动入口:【游戏内大厅】-【活动】-【听源梦的歌】-【奇幻梦之旅】活动时间
2025-03-12 21:20:00
美式截停失效了!仰望U7秀技术 100km/h侧追尾自动救车不失控
快科技3月12日消息,比亚迪今日公布的视频显示,仰望U7融合了易四方、云辇-Z两项核心技术,将动态下的车身姿态和车身稳定性提升到了一个新的高度
2025-03-12 21:20:00
赛车星冰乐模仿尊界法务语气维权:反诉尊界 要求道歉并赔偿250万
快科技3月12日消息,今日下午,尊界汽车法务发文称,正式起诉自媒体“赛车星冰乐”。尊界汽车法务表示,自媒体“赛车星冰乐”及其相关矩阵账号
2025-03-12 21:50:00
刘畊宏掉粉千万、跟MCN巨头解约,这“十万主播帝国”也不稳了
原标题 | 刘畊宏走了,无忧「十万主播帝国」还稳吗?「核心提示」10万签约主播,如何谋个好出路?掉粉近1200万,跟无忧传媒合作三年后解约
2025-03-13 00:06:00
沈腾马丽有新身份:被卫健委聘为职业健康宣传大使
快科技3月12日消息,据卫健委官网消息,今天职业健康宣传大使聘任仪式在北京举行,演员沈腾、马丽受聘为职业健康宣传大使。国家卫生健康委党组成员
2025-03-12 21:50:00
斯嘉丽回应再出演“黑寡妇”:她已经死了!
近日,曾在漫威电影宇宙 (MCU) 中饰演“黑寡妇”娜塔莎的演员斯嘉丽·约翰逊在接受采访时,回应了粉丝们要求她回归出演“黑寡妇”的请求
2025-03-12 22:20:00
“重温经典”电视频道火爆:用户规模超7000万户
快科技3月12日消息,国家广播电视总局宣,2025年2月,全国37个卫视频道收视率环比上涨,其中8个频道收视率涨幅超20%
2025-03-12 22:20:00
江南时报讯 作为扎根地方、服务民生的金融机构,南通农商银行始终秉承金融为民服务初心,聚焦客户、账户、用户三大核心要素,通过整合全渠道资源
2025-03-12 23:08:00
江南时报讯 今年以来,泗阳农商银行以新质生产力培育为导向,健全完善高效有力的内部审计体系,提高审计人员数据审计思维,强化数据资源分析
2025-03-12 23:08:00