• 我的订阅
  • 头条热搜
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
几天前 OpenAI 新模型 o1 的发布,再次引发了人们对大语言模型的高度关注和讨论。而 o1 发布之所以如此“轰动”,是因为它与此前大模型由语言驱动用于聊天或语音助手有本质的不同。其不仅进入到复杂的领域,还表现出超强...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
科学家竞相破解大型语言模型背后的谜团
...技日报ChatGPT如何“思考”——科学家竞相破解大型语言模型背后的谜团图片来源:视觉中国【科技创新世界潮】◎本报记者 刘 霞北京时间5月14日凌晨,美国开放人工智能研究中心(OpenAI)发布了其下一代大型语言模型GPT-4o,人...……更多
三个大模型组队挑战o1,实测360多模型协作干掉提示词工程
OpenAI o1的横空出世,开启了大模型演化的新范式——Inference law(推理定律)。正如英伟达AI科学家Jim Fan所说,o1的出现标志着大模型研发者开始把集中在训练阶段的投入,开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sut...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
【新智元导读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河
发布不到1周,OpenAI最强模型o1的护城河已经没有了。有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河这项研究表明,增加测试...……更多
圆桌论坛:ChatGPT的第一性原理:通往AGI的路上还有哪些系统性机会? | WISE2023颠覆AIGC产业发展峰会
...GC+数字化转型,以及资本视角,对于不同领域如何看待大模型浪潮下的机遇与挑战、如何推动AIGC应用大范围商业落地,以及着眼于未来AI2.0的发展方向充分阐述了各自的观点。乐言科技创始人兼CEO沈李斌谈到:我们如果要判断是...……更多
强化物理观念 考查创新思维
...动汽车的动力回收原理为背景,引导学生运用简单的物理模型理解生产实践中的高新技术,建立起用物理知识理解现实生活的桥梁;全国甲卷第20题将物理知识与“蹦床”运动紧密结合,激发学生参与体育运动的热情,引导学生...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
大模型领域的技术发展,今天起再次「从 1 开始」了。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...enAI放出了一个大招,预热了许久的“草莓”(Strawberry) 模型终于来了。“需要耐心等待的时刻结束了。”该公司CEO山姆·奥特曼(Sam Altman)说。这就是名为 o1的新模型,这次发布包括预览版o1-preview和小尺寸版o1-mini。OpenAI官方...……更多
谷歌大模型推理范式,主要分为两个阶段
...出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千...……更多
华东师范大学的老师,上课已经用上了大模型
...众号 QbitAI人在华东师范大学,上课、教学已经用上了大模型。例如丢一本《信息系统概论》进去,就可以开始提问了(哪里不会问哪里):讲解一下des加密算法。想要做题来巩固知识点?不用再搜往期试卷了。直接跟大模型说...……更多
超越ChatGPT:人类特有的思维要强化
...处在于商业化应用、不开源。由于后者基于深度神经网络模型,因此这一数据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足,可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
大模型领域竞争日趋激烈,腾讯又放出大招!2月27日,腾讯混元Turbo S模型在腾讯云官网上架,开发者和企业用户可以通过API调用,即日起一周内免费试用,同时将逐步在腾讯元宝灰度上线,供用户使用和体验。据介绍,此次升...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...硅谷新贵如MistralAI、Anthropic在那之后都争相发布了竞品大模型,但似乎至今还未有第二款大模型达到与GPT-4一般横扫科技圈的力量——直到GPT-4o的诞生。当地时间5月13日,OpenAI在万众期待中推出了名为GPT-4o的新一代旗舰AI模型。...……更多
巅峰对谈:迈向 AGI 时代,除了优秀的大模型,还需要什么?|WISE2023颠覆AIGC产业发展峰会
...a创始人兼CEO高雪峰,围绕《迈向 AGI 时代,除了优秀的大模型,还需要什么?》这一主题,展开了讨论,聚焦三个方面:图系统在提升大模型知识和推理能力中的价值及其技术发展难点和解决路径、当前大模型落地应用的重难点...……更多
国内创业者和投资人如何看待 Figure 01 机器人:距离具身智能还有多远?
...业者有什么新的启发?针对以上问题,我们采访了国内大模型和机器人行业的创业者、投资人,以下回答经 Founder Park 整理编辑。大模型+机器人,OpenAI 又「截胡」了 Google李志飞:出门问问创始人&CEO。 原理:Figure 类似 PaLM-E +...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
前些时日,AI 大模型开始掌握操作计算机的能力,但整体而言,它们与物理世界互动的能力仍处于早期阶段。为了提高 LLM 在复杂的现实世界中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链...……更多
...外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,...……更多
掰开揉碎告诉你,ChatGPT凭啥是人工智能“流量王”
...发点、生成式AI、人工智能算法框架技术演进、预训练大模型PLM、人工智能内容生成AIGC进行讨论,希望给读者以有益的启发。01 出发点:ChatGPT的第一性原理思维什么是第一性原理思维?简单来说就是回归本质,再进行重构。从...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解...……更多
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...任研究科学家。加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)回到正题。在...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。而这一切背后的机制是进化(evolution)。到了现今的大模型时代,强大的基础模型已经展现出了强大的智能水平,能完成多种多样的任务。但它们也有个缺点,训练之后就基本定型了,难以随着用户的使用而演进。但毫无疑问...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较了结果监督(outcome supervision)和过程监督(process supervision)两...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比如官...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
一、o1系列模型概况9月13日OpenAI宣布发布o1系列模型,o1系列模型包括o1、o1-mini以及抢先版o1-preview,o1-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...理的增长将远大于训练的增长;闭源和开源将共存,开源模型可能用于创建特定领域的应用程序;……(以下为重点部分整理) Q:关于个人AI助理的发展前景,您认为我们何时能在口袋里装上一个无所不知的AI助理?A:很快就...……更多
更多关于科技的资讯:
卢伟冰:去年就带团队去海尔学习 和周云杰深入交流
快科技3月21日消息,今天海尔周云杰发文宣布正式回归微博,此前他和雷军在代表通道上被大家关注。周云杰表示:我和小米雷总一起候场时“无意”的表情
2025-03-21 14:29:00
快消品牌新势力——“泉澄精酿”闪耀第112届全国春糖展
本文转自:人民网-山东频道3月20日,第112届全国糖酒商品交易会(酒店展)在成都拉开帷幕。作为中国食品行业的年度盛会
2025-03-21 14:29:00
大众网记者 李晓燕 通讯员 郑超 日照报道在金融科技迅猛发展的当下,支付手段愈发多元,支付安全与服务质量成为广大客户关注的核心
2025-03-21 14:35:00
TikTok提现的基本流程
在TikTok可以通过直播打赏、品牌合作、商品销售等方式赚取收益,取得收益后的目标都是将这些收入提现到国内的账户中。以下是TikTok提现的步骤
2025-03-21 14:42:00
政府工作报告点题低空经济,帆陌飞保破解万亿市场安全困局
2024年,低空经济首次被写入《政府工作报告》。今年全国两会上,政府工作报告再次指出,推动商业航天、低空经济等新兴产业安全健康发展
2025-03-21 14:45:00
海尔“吊智眼”系统:为行车安全装上“智慧大脑”
鲁网3月21日讯(记者 孙强)在工业生产中,起重机械是重要的搬运设备,但也隐藏着诸多安全隐患。据统计,全国起重机械数量超2900000台
2025-03-21 14:47:00
关注青年所思所想 珍爱网挖掘婚恋服务更多可能
在当今社会,青年婚恋正逐渐成为社会各界瞩目的焦点话题。随着生活节奏的日益加快以及社交方式的不断演变,许多青年在寻觅人生伴侣的旅程中遇到了诸多现实挑战——快节奏生活压缩社交空间
2025-03-21 14:57:00
马斯克:我每次从电视前走过 都会看到一辆特斯拉着火
快科技3月21日消息,据报道,特斯拉CEO马斯克在本周四在德克萨斯州奥斯汀举办全体员工大会,给员工打气。会上,马斯克表示
2025-03-21 14:59:00
《王者荣耀》又免费送皮肤了:钟馗有了哪吒般火焰发型
快科技3月21日消息,《王者荣耀》宣布S39新赛季即将带到来,赛季皮肤——钟馗虚灵犬护皮肤也将上线。【钟馗-虚灵犬护】为勇者品质皮肤
2025-03-21 14:59:00
王冰冰和董宇辉组CP探展格力电器 遭“丈母娘”们现场围堵
快科技3月21日消息,今日,央视主持王冰冰和与辉同行创始人兼CEO董宇辉一起联动,出席了格力电器在AWE中国家电及消费电子展会的展位
2025-03-21 14:59:00
王腾微博发起定价讨论:到底什么价位的手机才是人人都买得起
快科技3月21日消息,REDMI总经理王腾在微博发起讨论:大家觉得手机在什么价位是人人都买得起的?评论区网友观点不一,点赞相对较高的评论是1500元左右
2025-03-21 14:59:00
长城汽车回应APP崩了致车主被锁车外:已恢复正常
快科技3月21日消息,今日上午,有网友反馈,长城汽车APP突然崩溃,致使众多没带实体钥匙的车主锁到车外。发生故障后,不少车主纷纷跑到长城汽车官微下方进行评论留言
2025-03-21 14:59:00
近日,中共中央办公厅、国务院办公厅印发的《提振消费专项行动方案》明确提出要“开辟高成长性消费新赛道”,这一表述不仅是支持新型消费加快发展的重要体现
2025-03-21 15:11:00
一台29年前购入的老设备 劲牌公司为何不舍得报废?
消费日报网讯(记者 默晓龙 □柯华林)3月中旬,劲牌公司关于“清香型白酒微生物研究”的论文登上全球食品顶级期刊——《食品科学当前研究》
2025-03-21 15:21:00
京东内衣采销“红马甲”亮相潮汕服博会 以专业能力助力厂商转型突破
3月18日,第四届潮汕国际纺织服装博览会(以下简称“潮汕服博会”)在汕头国际会展中心举办。展会期间,京东服饰联合汕头市纺织服装产业协会
2025-03-21 15:22:00