• 我的订阅
  • 头条热搜
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
科学家竞相破解大型语言模型背后的谜团
...技日报ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团图片来源:视觉中国【科技创新世界潮】◎本报记者 刘 霞北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
强化物理观念 考查创新思维
...动汽车的动力回收原理为背景,引导学生运用简单的物理模型理解生产实践中的高新技术,建立起用物理知识理解现实生活的桥梁;全国甲卷第20题将物理知识与“蹦床”运动紧密结合,激发学生参与体育运动的热情,引导学生...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
华东师范大学的老师,上课已经用上了大模型
...众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不会问哪里):讲解一下des加密算法。想要做题来巩固知识点?不用再搜往期试卷了。直接跟大模型说...……更多
超越ChatGPT:人类特有的思维要强化
...处在于商业化应用、不开源。由于后者基于深度神经网络模型,因此这一数据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足,可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
大模型领域竞争日趋激烈,腾讯又放出大招!2月27日,腾讯混元Turbo S模型在腾讯云官网上架,开发者和企业用户可以通过API调用,即日起一周内免费试用,同时将逐步在腾讯元宝灰度上线,供用户使用和体验。据介绍,此次升...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多
寻 “车轮” 之秘密,探 “数学” 之真谛 济微中学六年级项目化学习实践纪实
...动关系)。学习任务单二:建构传动比与骑行距离的数学模型1.实践困惑:实测骑行距离存在误差,如何通过理论计算提升精度?2.逻辑推导:前齿轮转 1 圈,后齿轮转动圈数 = 前齿轮齿数 ÷ 后齿轮齿数(齿轮传动比原理)。...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
...证能力、探究与创新能力的考查。例如:试题通过图表、模型、文本等各类信息考查信息获取与加工能力,通过元素推断,有机推断等考查逻辑推理与论证能力,通过性质用途对应的方式考查批判性思维与辩证能力,以表格型实...……更多
...外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,...……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
...-V3迎来一波更新,升级至「DeepSeek-V3-0324」版本。 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
国内首个通过主任医师评测的大模型,已在夸克AI搜索上线
7月23日消息,夸克健康大模型成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。目前,“主任级AI医生”能力已全面集成至夸克的AI搜索中,用户在查询健康问题时,选择深度搜索即可调用...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比如官...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
更多关于科技的资讯:
新闻纵深·冀货出海新探索|平乡自行车童车:从“贴牌代工”到“骑向全球”
平乡自行车童车出口销量占国际市场的百分之四十从“贴牌代工”到“骑向全球”阅读提示平乡县,被誉为“中国童车之都”。在这里
2025-12-08 08:26:00
杭州市康复医院近日组织开展第34个国际残疾人日宣传教育活动。“杭州市智能仿生假肢适配服务基地”在本次活动上揭牌成立。未来将为肢体残疾人提供智能仿生假肢适配相关服务
2025-12-08 09:24:00
米连科技率先跑通新赛道,成实时视频情感社交重要实践者与引导者
当众多社交平台仍在探索可持续的商业模式时,米连科技通过将“视频社交+实时互动”作为产品核心,不仅成功开辟了新的市场空间
2025-12-08 09:24:00
国际人才嘉年华2025(秋季)盛大启幕丨科创动能全景绽放,多元机遇职引未来!
《2025年世界人才排名》显示,香港已跃居全球第四、亚洲首位,彰显了港府近期在人才引进与培育方面取得显著成效。港府推行的多项人才计划累计收到申请逾52万份
2025-12-08 10:24:00
“苏新消费·暖冬购物季”正式启动 苏宁易购这波精彩 很给“利”
12月5日,2025“苏新消费·暖冬购物季”正式启幕,本次购物季将持续至2026年3月。重点围绕十三地市“苏品苏货”,结合“双12”
2025-12-08 10:28:00
工行河北省分行:金融“活水”浇开智造之花 为科技自立自强蓄能加力
从7人团队起步,到现已成长为年营收超40亿元的全国电气百强企业,科林电气在智能电网领域成果斐然。工行河北省分行以源源不断的金融活水和与时俱进的智慧服务精准滴灌
2025-12-08 10:36:00
近期,民生银行张家口分行全面开展“金融护航·幸福养老”主题宣传活动,以专业服务赋能养老规划,以暖心举措守护金融安全。多维布局
2025-12-08 10:41:00
王涵不是戴上面具之后才能放飞自我,而是那个看似放飞的自我其实是面具的产物。对于社会交往而言,认为需要加入或取消某种媒介才能体验交往的快乐
2025-12-08 10:54:00
人工智能不仅是一种技术,也是一个产业,更是一个时代。最近,AI杭州的目光纷纷投向钱江世纪城。先是长三角首个“芯-模-用”全链条AI产业社区芯模社区启航
2025-12-08 07:52:00
为期三天的消费狂欢落下帷幕!12月7 日,第六届杭州市中小商贸流通企业服务节暨2025惠民汽车消费季在拱墅区运河广场圆满收官
2025-12-08 07:52:00
刘沛雨摘要:本文主要从转型升级时期中小企业的管理创新方面展开分析,在市场发展变化迅速的局面下,通过应用一些管理创新手段和方法
2025-12-08 05:10:00
正值中国首个跨境电商综试区——杭州综试区设立十周年,也恰逢亚马逊全球开店(以下简称“亚马逊”)业务在中国开展运营十周年的重要里程碑
2025-12-08 07:21:00
杭州商业航天产业迎来重磅落子。近日,箭元科技与钱塘(新)区签署协议,其“元行者一号”液体运载火箭回收复用基地正式落地钱塘(新)区前进智造园
2025-12-07 08:23:00
近日,一项重要国家标准——《电磁兼容 电磁兼容标准起草导则》工作会议在云栖小镇召开。这份由上海机器人产业技术研究院牵头起草的文件
2025-12-07 08:53:00
湖北农发旗下米来生物荣获2025欧洲食品配料展食品与饮料技术创新大奖
12月2日,法国巴黎,在欧洲食品科技领域最具影响力的盛会——欧洲食品配料展(Food Ingredients Europe
2025-12-07 16:44:00