国内国际社会时尚情感人文汽车健康

头条订阅服务

体育娱乐财经军事科技游戏教育育儿

三国以色列人工智能AI ChatGPT 数字经济

我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

类别：科技发布时间：2024-09-21 09:43:00 来源：新智元

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

【新智元导读】随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？

随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。

靠着CoT的强力加持，o1直接在LLM领域首次实现了通用复杂推理能力，俨然是AI发展新范式的开端。

许多人惊呼：莫非CoT就是通往AGI的正确路径？

而且，o1这种慢思考模式不仅帮助LLM做数学和符号推理，甚至，还让LLM发展出了类人情感！

最近，斯坦福等机构学者发文证实：LLM在情感方面表现出的认知和推理比人类还像人类，背后最大贡献者竟然就是CoT。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

就在这几天，风口浪尖上的CoT，又让AI社区掀起了一场风波。

谷歌DeepMind首席科学家称LLM推理无极限，LeCun田渊栋回怼

CoT爆火之后，谷歌DeepMind首席科学家Denny Zhou拿出了自己团队八月份的一篇论文，抛出了这样的观点：「LLM推理能力的极限是什么？那就是没有限制」。

他表示，谷歌团队已经用数学方法证明，Transformer可以解决任何问题，只要允许它们根据需要生成任意数量的中间推理token。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

可以看出，Denny Zhou等人提出的中间推理token，跟o1的核心技术CoT非常相似。

传统的Transformer模型的致命弱点，就是擅长并行计算，但不擅长串行推理。

而CoT，恰恰解决了这个问题。

在这项工作中，Denny Zhou等人发现：传统的Transformer模型，只能解决AC0电路能解决的问题；但一旦加入CoT，Transformer几乎可以解决任何问题。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

只要CoT步骤足够多，Transformer就能模拟任意大小的布尔电路，解决P/poly问题

也就是说，可以用数学严格证明，CoT可以让Transformer解决几乎所有能用计算机解决的问题。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

利用CoT，可以模拟布尔电路中每个逻辑门的计算

这项工作暗示着，CoT为更强大的LLM推理提供了新的思路，CoT或将成为未来LLM发展的重要方向，而且很可能闪烁着AGI的火花。

Denny Zhou发帖后，立即引发了AI社区的热议。

多位研究者下场讨论，也惊动了其他大佬。

这不，就在刚刚，田渊栋和LeCun依次发表意见，回怼了Denny Zhou。

在他们看来，CoT的作用，被远远夸大了。

田渊栋表示，虽然CoT的确很有用，但Denny Zhou等人对其过于盲目追捧了，显然，CoT并不是我们所需要的一切。

在这篇论文中提到的是一种通用理论，可以通过显式构建Transformer权重，让其更好地适应特定任务。

然而这样，CoT的长度就会很长，这样的权重配置，能否通过梯度下降来学习呢？

理论上，2层多层感知器是可以拟合任何数据的，那我们就该相信它可以应用在所有场景中吗？

人类的推练链是十分简洁的，面对从未见过的问题，也能捕捉关键因素。但LLM可以吗？

如何在瞬间就学习或构建出这样的表征，是很令人着迷的。

田渊栋的帖子一发出，立刻就获得了LeCun的支持。

LeCun表示，自己本来也想发表类似的言论，不巧被田渊栋抢先了。

「2层网络和核机器可以无限逼近任何函数，达到我们想要的精度，所以我们不需要深度学习。」

从1995年到2010年，LeCun听到这个说法无数遍了。

当然，这个操作理论上是可行的。但如果真的在实践中应用所有相关的函数，光是第一层中的神经元数量就会多到不可思议。

对此，网友的评价是：收敛和等价证明被高估了，高效的学习策略被低估了，就是这样。

「我很高兴Python的存在，尽管Pascal是图灵完备的。」

一位从业者表示，自己的研究是从一个隐藏层MLP判别式开始，然后就是CNN或Deep NN等专业模型。

他的判断是：较小的模型更稳健、更可解释，而且通常很接近，但永远不会那么好。而使用更深层次的模型，总是会有额外的百分比。

很多人是「挺CoT派」的。比如有人表示理解LeCun的观点，但在多维扩展场景中，CoT绝对大有潜力。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

而对于LeCun所担心的问题，有网友表示，LeCun在采用一种自上而下的策略，在这种情况下他必须控制所有的第一层输入，但其实，他并不需要。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

因为，CoT通过创建了新的临时层，让人放弃了对这种控制的幻想。其解决方案就是，通过网络层的一般形式，来逼近注意力头本身。

有趣的是，该网友表示，自己的灵感来源是《物理学》上的一封信，表明量子全息拓扑能更有效地满足这一点。

即使爱因斯坦-罗森桥的边界相当大，它可以更连续地离散表示为无数不同的小层，横跨所产生的平坦空间。这，就是表征的力量所在。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

有人表示，这个讨论没什么意思，本质上不过是「无限猴子定理」罢了。

让一只猴子在打字机上随机按键，当按键时间达到无穷时，几乎必然能打出任何给定文字，比如莎士比亚全集。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

田渊栋：可以发展，但更复杂

最终，田渊栋也承认，谷歌这篇论文的思路的确有可取之处。然而由于涉及到不同的数据分布、模型架构、学习算法、后处理等等，问题还要更复杂。

正如Evolutionary Scale联创Zeming Lin所言：我们需要像乔姆斯基层次结构这样的机器学习模型。就像ML模型有NP、P、O(n^2) 等概念一样，Transformer或Mamba属于哪里呢？

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

而在田渊栋发帖的第二天，谷歌论文主要作者马腾宇也上线评论说：CoT的长度是可以超长的。

2层MLP中的神经元数量呈指数级，才能逼近几乎任何函数。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

田渊栋回复他说：对那些可能需要指数数量的门的问题，CoT的长度可以很长。

这和2层MLP情况是一致的，因为无论拟合任意函数，都需要覆盖高维空间中的所有角，这是最坏的情况。

然而，现实世界的问题，是否有如此良好/简洁的表征呢？如果它们都像NC1一样，属于P问题，那么当然可以通过构建Transformer的权重来做到。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

在最近一条X帖子中，田渊栋表示，自己的想法是，能够找到更短的CoT，同时使用专家迭代（穷人的RL）来保持最佳结果。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

从公开信息来看，他推断o1也是在做类似的事情。至于初始化过程，可能是使用了大量高质量的人类推理链。

人类是如何想出简洁的CoT呢，这就不为人所知了。

趁此机会，他还宣传了一下自己团队Searchformer的论文。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

论文地址：https://arxiv.org/abs/2402.14083

总之，虽然我们还不知道如何拓展2层神经网络，但OpenAI似乎确信自己已经掌握了拓展CoT的秘诀。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

最新讲座：揭示LLM推理的关键思想和局限

目前，这场空前热烈的讨论还在继续。

而关于LLM推理，Denny Zhou最近在UC伯克利也进行了一场类似主题的讲座。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

他表示，自己对AI的期待是可以像人类一样从较少的示例中进行学习。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

但曾经尝试的种种机器学习方法之所以都不成功，是因为模型缺失了一种重要能力——推理。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

人类之所以能从较少的示例中学习到抽象的规律和原理，就是因为推理能力。正如爱因斯坦所说的，「Make things as simple as possible but not simpler」。（一切都应该尽可能简单，但不能过于简单）

比如，对于下面这个问题：

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

对人类而言，这是一道小学水平的「找规律」。

但机器学习需要海量的标注数据才能找出其中的规律。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

而LLM的少样本学习更是难以解决。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

但如果在数据中加入「推理过程」，LLM就很容易有样学样，学习到少量样本示例中展现出的规律，并给出正确答案。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

通过这个简单的例子，Denny Zhou指出，关键想法是在数据中包含中间步骤，或者是解释原理（rationale），同时让模型写出推导过程。

这就是使用CoT背后的逻辑和直觉。

「中间步骤」，为何如此重要

DeepMind的研究者们，率先使用自然语言原理去解决数学问题。

关键就在于从头开始训练了一个序列到序列模型，从而通过一系列小步骤得出最终答案。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

继这项工作后，OpenAI的研究者们建立了一个更大的数学单词问题数据集（GSM8K），其中包含自然语言基本原理，并利用它对GPT-3进行了微调。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

这样，语言模型的中间计算步骤，就被展示了出来。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

o1模型的奠基性贡献者之一Jason Wei在谷歌大脑工作时曾和Denny Zhou发表了一篇论文，指出CoT提示可以引导出LLM的推理能力。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

Denny Zhou甚至更直白地指出样本「中间步骤」的重要性：无论是训练、微调还是提示，都需要给出中间步骤，才能让LLM在响应中也包含中间步骤。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

实际上，这也是Denny Zhou、马腾宇最近论文的核心观点。如果能生成足够长的中间推理步骤，常数深度的Transformer模型也能解决任何串行问题。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

CoT并不是一切

但是，这也并不意味着CoT可以包打一切，解决LLM推理的所有缺陷。

比如，模型很容易被无关的上下文干扰，这一点和人类思维也很类似。

实验中发现，在GSM8K数据集中添加无关上下文，可以导致模型性能出现高达20+百分点的损失。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

此外，LLM的自我纠正能力也并不健全。

虽然有些模型在反思后可以成功修改错误答案，但也存在另一种风险——可能反而把正确答案改错。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

那么，LLM的下一步应该往何处去？

Denny Zhou指出，虽然我们已经知道了模型推理有哪些缺陷和不足，但最重要的还是定义好问题，再从第一性原理出发去解决。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

此处，再引用一句爱因斯坦的话：「如果有1小时用来拯救星球，我会花59分钟来定义问题，然后用1分钟解决它。」

一些质疑

虽然Denny Zhou的演讲内容相当详实，但「CoT实现推理无极限」的论断确实相当大胆，因此也引起了网友的反驳。

比如有人指出，前提中所谓的「无限多token」只是在理论上可行，在实践中未必如此。

token数量很有可能随输入增加呈现指数增长，问题变得越来越复杂时，token数量逼近无限，你要怎么处理？

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

而且，LLM推理和人类还存在本质差异。AI目前只能进行暴力搜索（brute-force），但人类有所谓的「启发式」思考，「直觉」让我们能将数百万种可能性快速缩减至几种可行的解决方案。

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

如果想达到AGI，AI系统就需要模拟出这种高效的问题解决路径。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-09-21 11:45:04

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于天花,天花板,推理,首席,科学家,科学的资讯：

连载12年，不愧是美剧天花板

连载12年，不愧是美剧天花板

12年，245集，两座艾美奖。这部改编自法庭人类学家凯丝·莱克斯同名小说的经典美剧。自2005年开播以来，以12季的超长篇幅，成为犯罪题材剧集中难以超越的经典。《识骨寻踪》故事围

2025-03-09 13:08:00

中国也有Sora同款训练架构公司，清华班底，智谱也投了 | 36氪首发

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...，也让生数科技立刻调整了战略。以往AI生成视频的长度天花板，是Runway Gen-3的18秒，如今Sora将天花板抬高到了60秒

2024-03-14 15:12:00

DeepSeek开源惠四方（科技名家笔谈）

DeepSeek开源惠四方（科技名家笔谈）

...科学家伊利亚·苏茨克维等人甚至直言，规模法则已触及天花板。DeepSeek的出现，促使全球AI界严肃地思考这一技术发展路线问题：是继续烧钱豪赌，还是另辟蹊径，在算法优化上下更

2025-02-24 05:52:00

大江东｜在首届浦江AI学术年会，感受人工智能加速跑

大江东｜在首届浦江AI学术年会，感受人工智能加速跑

...云涌，能力一节高过一节，应用一浪超过一浪，不断突破天花板。”李萌简洁而细致地盘点了人工智能技术的快速进展：今年初，Sora惊艳登场，李飞飞的AI Agent和空间智能开创了认

2024-12-24 15:57:00

想做企业级智能体的「AutoAgents」，获数千万元天使轮融资 | 涌现好项目

想做企业级智能体的「AutoAgents」，获数千万元天使轮

...值链条中获取持续性收益，这能突破传统软件销售的营收天花板。• 企业软件正从“工具付费”转向“结果付费”，Agent 的核心价值在于服务结果导向，通过标准化的Agent产品和行

2025-03-11 05:56:00

具身智能如何再进化？庞江淼：“虚实贯通”将成推动机器人自主演进的可行路径

具身智能如何再进化？庞江淼：“虚实贯通”将成推动机器人自主演

...大脑层面发展，核心挑战仍在于如何突破基础推理能力的天花板，实现从简单推理向中难度逻辑推导的认知跃升。“如果把A拿到B，它（机器人）其实知道怎么办。但是如果我把一个绿色的东西放

2025-02-26 14:49:00

打破发展“天花板” 壮大科创“她力量”

打破发展“天花板” 壮大科创“她力量”

...支持政策，已经取得了良好效果。如果想彻底打破发展“天花板”，还要进一步推动社会观念的转变。对此，袁亚湘认为，应进一步加强宣传力度，提升公众的性别平等意识，消除社会对女性投身科

2024-01-15 01:46:00

人类计时器“天花板” 这种钟的误差可以达到3000亿年只差1秒

人类计时器“天花板” 这种钟的误差可以达到3000亿年只差1

发现并归纳元素周期律的门捷列夫曾经说过，“科学是从测量开始的”，这句话的意思是说，没有精密测量就没有现代自然科学，而测量精度的提高往往会带来新的科学规律发现。门捷列夫，发现并归纳

2025-01-31 08:08:00

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...工智能（AGI）铺平道路？数学一直被视为人类智力的“天花板”，数学家则不断在挑战人类智力的极限。同时，数学难题也一直是大模型难以“征服”的领域之一。数学是推理的语言。长期

2024-06-14 11:54:00

更多关于科技的资讯：

高通第四代骁龙8s支持新一代帧生成算法：60fps游戏秒变120fps

高通第四代骁龙8s支持新一代帧生成算法：60fps游戏秒变1

快科技4月2日消息，今日下午，高通正式推出了第四代骁龙8s移动平台，这一新品在多个关键领域实现了显著升级。首先，其采用了全大核CPU架构

2025-04-02 18:40:00

美国加征25%让低价车无钱可赚奔驰考虑在美撤下入门车型

美国加征25%让低价车无钱可赚奔驰考虑在美撤下入门车型

快科技4月2日消息，据报道，美国将对进口汽车加征25%的额外关税，自4月2日起生效。分析师称，这将使每辆汽车的成本增加数千美元

2025-04-02 18:40:00

REDMI首发！高通第四代骁龙8s正式发布：系列首次全大核

REDMI首发！高通第四代骁龙8s正式发布：系列首次全大核

快科技4月2日消息，今天下午，高通正式发布了全新旗舰平台——第四代骁龙8s。高通将其定义为“新生代旗舰”，专为追求出色娱乐体验和创作体验的用户打造

2025-04-02 18:40:00

蔚来乐道总裁官宣离职：辜负期待深感愧疚

蔚来乐道总裁官宣离职：辜负期待深感愧疚

“做不到，就下课”3月销量放榜第二天，蔚来乐道品牌总裁艾铁成兑现承诺，官宣离职。去年11月广州车展上，艾铁成公开立下“军令状”

2025-04-02 18:40:00

3月交付过没过两万：蔚来乐道总裁艾铁成“下课”

3月交付过没过两万：蔚来乐道总裁艾铁成“下课”

难抵压力，乐道汽车总裁艾铁成还是“下课了”。4 月 2 日上午，艾铁成通过乐道 App 发表文章宣布离职，不再担任乐道汽车总裁和蔚来高级副总裁

2025-04-02 18:40:00

小米汽车司机驾驶中睡着上热搜客服回应：智驾系统只是辅助

小米汽车司机驾驶中睡着上热搜客服回应：智驾系统只是辅助

快科技4月2日消息，近日，有网友曝光小米汽车车主驾驶中睡着，双手离开方向盘。同行友人连喊三遍“减速”避让小米汽车。据视频显示

2025-04-02 18:40:00

永辉高管谈调改于东来直接打断！质问月赚200万为何不涨工资

永辉高管谈调改于东来直接打断！质问月赚200万为何不涨工资

快科技4月2日消息，在近日的2025中国超市周活动现场，永辉超市负责调改的高管正在台上演讲，被胖东来创始人于东来登台打断

2025-04-02 18:40:00

博主吐槽新能源汽车门把手根本找不到打车感觉自己像土鳖

博主吐槽新能源汽车门把手根本找不到打车感觉自己像土鳖

快科技4月2日消息，近日，一位博主在社交媒体上吐槽新能源汽车的门把手设计，引发了广泛关注和讨论。随着网约车的普及，乘客们发现

2025-04-02 18:40:00

全球富豪榜变化：马斯克仍高居榜首巴菲特跃居第五

全球富豪榜变化：马斯克仍高居榜首巴菲特跃居第五

今年年初，全球千亿美元级超级富豪数量为16人，但如今已降至13人。这一变化源于美股在一季度遭遇自2022年以来最严重的季度跌幅

2025-04-02 19:10:00

REDMI/iQOO首批商用！一图了解高通第四代骁龙8s

REDMI/iQOO首批商用！一图了解高通第四代骁龙8s

快科技4月2日消息，今天下午，高通正式发布第四代骁龙8s。据悉，第四代骁龙8s基于台积电4nm工艺制造，其Kryo CPU采用1+3+2+2的 “1超7大” 架构设计

2025-04-02 19:10:00

比亚迪21%毛利率背后的变革

比亚迪21%毛利率背后的变革

2025年只过了3个月，比亚迪的营收能力再次震慑车圈。3月24日，比亚迪发布2024年财务报告。财报显示，2024年比亚迪营业收入7771

2025-04-02 19:10:00

告别人工！武汉体育中考引入AI智能判定系统：涉及近10万名学

快科技4月2日消息，据媒体报道，4月1日至18日，武汉近10万名初三生参加体育中考，全面采用“智能设备+云端管理”模式

2025-04-02 19:10:00

算法并非万能！央视呼吁：“智能驾驶”也请握紧方向盘

算法并非万能！央视呼吁：“智能驾驶”也请握紧方向盘

快科技4月2日消息，近日，有关智能驾驶而引发的交通事故在网络上引起了大家的热烈讨论，对此，央视网评指出，“智能驾驶”，也请握紧方向盘

2025-04-02 19:10:00

中石油管道局科新公司破解纳米孔洞“结构密码”

中石油管道局科新公司破解纳米孔洞“结构密码”

河北新闻网讯（杨志明、杨洁、张珊榕）近日，中石油管道局投运公司中油科新化工有限公司（以下简称“科新公司”）在纳米材料研究领域获得重要突破

2025-04-02 19:17:00

真正的Windows on Arm！大神最新魔改成果：智能手表运行Windows

真正的Windows on Arm！大神最新魔改成果：智能手

快科技4月2日消息，近日，名为Gustave Monce的开发者最新成果惊呆了众多网友，他成功将Windows操作系统运行在智能手表上

2025-04-02 19:40:00