• 我的订阅
  • 头条热搜
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
科学家竞相破解大型语言模型背后的谜团
...技日报ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团图片来源:视觉中国【科技创新世界潮】◎本报记者 刘 霞北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
强化物理观念 考查创新思维
...动汽车的动力回收原理为背景,引导学生运用简单的物理模型理解生产实践中的高新技术,建立起用物理知识理解现实生活的桥梁;全国甲卷第20题将物理知识与“蹦床”运动紧密结合,激发学生参与体育运动的热情,引导学生...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
华东师范大学的老师,上课已经用上了大模型
...众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不会问哪里):讲解一下des加密算法。想要做题来巩固知识点?不用再搜往期试卷了。直接跟大模型说...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...理的增长将远大于训练的增长;闭源和开源将共存,开源模型可能用于创建特定领域的应用程序;……(以下为重点部分整理) Q:关于个人AI助理的发展前景,您认为我们何时能在口袋里装上一个无所不知的AI助理?A:很快就...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...引入思想链(CoT,Chain of Thought)的概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...稿邮箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com大语言模型 (LLM) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类...……更多
商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
...秋,“日日新·商量”又拿了金牌!今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。商量多模...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「标准答案」了。近日,一篇麻省理工学院(MIT)等机构发表在顶...……更多
CPU,正在被AI时代抛弃?
...对话可以通过语音识别技术被录入到病例系统中,随后大模型AI推理技术辅助进行智能总结和诊断,医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间,也保护了患者隐私;在法院、律所等业务场景中,律师通过大...……更多
Llama版o1来了,来自上海AI Lab,强化学习代码已开源,
复刻OpenAI o1推理大模型,开源界传来最新进展:LLaMA版o1项目刚刚发布,来自上海AI Lab团队。简介中明确:使用了蒙特卡洛树搜索,Self-Play强化学习,PPO,以及AlphaGo Zero的双重策略范式(先验策略+价值评估)。在2024年6月,o1发...……更多
...惠》主题演讲。演讲中,他系统阐述了联想对人工智能大模型技术浪潮的洞察与业务布局,首次完整定义了未来AI PC(人工智能电脑)所具备的五大特质。两大行业趋势推动AI PC应运而生杨元庆提到,丰富多样的公共大模型为人...……更多
更多关于科技的资讯:
日本流感到底有多严重:累计病例超950万占总人口1/13 过度囤购致药品短缺
快科技2月3日消息,据央视报道,日本自去年12月下旬流感患者人数创下新高之后,一些医院和药店受部分医疗机构过度囤购药品造成库存分布不均等因素影响
2025-02-03 15:10:00
NVIDIA新款入门显卡RTX 5060/5060 Ti三月登场 媒体:定价400美元以内比较实际
快科技2月3日消息,RTX 5090、5080价格高不可攀,官价根本买不到。对于普通玩家来说,入门款RTX 5060 Ti和 RTX 5060才更切实际
2025-02-03 16:40:00
AMD下下代AI加速卡Instinct MI400大变!多了一个Die
快科技2月3日消息,AMD已官宣将在今年下半年发布新一代Instinct MI350系列AI加速卡的首款产品MI355X
2025-02-03 17:10:00
每次飞行都是温暖守护
本文转自:人民网-辽宁频道1月29日,天刚蒙蒙亮,在盘锦市欢喜岭地区,茫茫苇海一望无际,穿梭在其中的欢兴720、820输气管道在随风起伏的苇杆中时隐时现
2025-02-03 17:21:00
NVIDIA RTX 60系列用上更大显存:DLSS 5性能再翻倍
快科技2月3日消息,NVIDIA RTX 50系列显卡刚发布开售不久,关于RTX 60系列显卡的爆料就已经来了。根据最新的泄露信息
2025-02-03 09:40:00
Intel XeSS游戏已达159款!但是XeSS 2只有两款
快科技2月3日消息,Intel在三大厂中率先发布了新一代显卡,锐炫B580凭借不错的性能、12GB的大显存、高超的性价比占据了一席之地
2025-02-03 09:40:00
特斯拉Model 3深陷海滩:越野车、皮卡救援无果 还得铲车上!
快科技2月3日消息,奉劝大家不有事没事开车上海滩上,一旦陷车,真不是那么容易救援的,如果恰好碰到涨潮,怕是车子都要废了
2025-02-03 09:40:00
DeepSeek引发美国地震!怀疑中国通过新加坡获取NVIDIA AI芯片
快科技2月3日消息,DeepSeek大模型的出色表现引发美国AI行业上下震动,不仅性能与OpenAI O1旗鼓相当,更关键的是训练成本低得多
2025-02-03 10:10:00
三星Galaxy Watch 5成功以60帧运行GTA:《战神》也不在话下
快科技2月3日消息,近日Reddit用户ZenonDesingk成功在三星Galaxy Watch 5智能手表上运行了多款经典游戏
2025-02-03 10:10:00
跟黄牛买了块便宜的RTX 3090:GPU、显存全都不见了!
快科技2月3日消息,NorthridgeFix是一家阅历极为丰富的硬件维修机构,见过各种各样奇奇怪怪的损坏产品,但最近收到的一块RTX 3090却相当疯狂
2025-02-03 10:40:00
突发!女艺人大S去世:在日本流感并发肺炎 年仅48岁
快科技2月3日消息,近日,媒体出现关于中国台湾艺人大S(徐熙媛)因急性疾病在日本去世的传闻,引发广泛关注和热议。根据多家媒体最新报道
2025-02-03 11:10:00
大S因流感并发肺炎去世!这波日本流感到底有多猛:高峰时1周258万人就医
2月3日消息,据国内媒体报道,中国台湾女演员、歌手、主持人徐熙媛(大S)因流感并发肺炎去世。小S发文:谢谢大家的关心!新年期间
2025-02-03 11:40:00
准时发布有望:《GTA6》被曝已能从头玩到尾
快科技2月3日消息,《GTA6》近期传出可能推迟到2026年发售的消息,引发了众多玩家的担忧,不过前R星开发者迈克·约克(Mike York)的最新言论为玩家们带来了希望
2025-02-03 11:40:00
大S去世 日本流感引网友关注:1999年以来感染人数最多的一次
2月3日消息,中国台湾女演员、歌手、主持人徐熙媛(大S)因流感并发肺炎去世。随后,日本流感登上微博热搜,引发国内网友关注
2025-02-03 12:40:00
大S流感并发肺炎去世:感冒出现这些症状千万别拖!
据澎湃新闻,中国台湾女演员、歌手、主持人徐熙媛(大S)因流感并发肺炎去世,年仅48岁。流感(Influenza)在中文中称为“流行性感冒”
2025-02-03 12:40:00