• 我的订阅
  • 科技

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

类别:科技 发布时间:2024-09-21 09:43:00 来源:新智元

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

【新智元导读】随OpenAI爆火的CoT,已经引发了大佬间的激战!谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?

随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。

靠着CoT的强力加持,o1直接在LLM领域首次实现了通用复杂推理能力,俨然是AI发展新范式的开端。

许多人惊呼:莫非CoT就是通往AGI的正确路径?

而且,o1这种慢思考模式不仅帮助LLM做数学和符号推理,甚至,还让LLM发展出了类人情感!

最近,斯坦福等机构学者发文证实:LLM在情感方面表现出的认知和推理比人类还像人类,背后最大贡献者竟然就是CoT。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

就在这几天,风口浪尖上的CoT,又让AI社区掀起了一场风波。

谷歌DeepMind首席科学家称LLM推理无极限,LeCun田渊栋回怼

CoT爆火之后,谷歌DeepMind首席科学家Denny Zhou拿出了自己团队八月份的一篇论文,抛出了这样的观点:「LLM推理能力的极限是什么?那就是没有限制」。

他表示,谷歌团队已经用数学方法证明,Transformer可以解决任何问题,只要允许它们根据需要生成任意数量的中间推理token。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

可以看出,Denny Zhou等人提出的中间推理token,跟o1的核心技术CoT非常相似。

传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。

而CoT,恰恰解决了这个问题。

在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的问题;但一旦加入CoT,Transformer几乎可以解决任何问题。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

只要CoT步骤足够多,Transformer就能模拟任意大小的布尔电路,解决P/poly问题

也就是说,可以用数学严格证明,CoT可以让Transformer解决几乎所有能用计算机解决的问题。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

利用CoT,可以模拟布尔电路中每个逻辑门的计算

这项工作暗示着,CoT为更强大的LLM推理提供了新的思路,CoT或将成为未来LLM发展的重要方向,而且很可能闪烁着AGI的火花。

Denny Zhou发帖后,立即引发了AI社区的热议。

多位研究者下场讨论,也惊动了其他大佬。

这不,就在刚刚,田渊栋和LeCun依次发表意见,回怼了Denny Zhou。

在他们看来,CoT的作用,被远远夸大了。

田渊栋表示,虽然CoT的确很有用,但Denny Zhou等人对其过于盲目追捧了,显然,CoT并不是我们所需要的一切。

在这篇论文中提到的是一种通用理论,可以通过显式构建Transformer权重,让其更好地适应特定任务。

然而这样,CoT的长度就会很长,这样的权重配置,能否通过梯度下降来学习呢?

理论上,2层多层感知器是可以拟合任何数据的,那我们就该相信它可以应用在所有场景中吗?

人类的推练链是十分简洁的,面对从未见过的问题,也能捕捉关键因素。但LLM可以吗?

如何在瞬间就学习或构建出这样的表征,是很令人着迷的。

田渊栋的帖子一发出,立刻就获得了LeCun的支持。

LeCun表示,自己本来也想发表类似的言论,不巧被田渊栋抢先了。

「2层网络和核机器可以无限逼近任何函数,达到我们想要的精度,所以我们不需要深度学习。」

从1995年到2010年,LeCun听到这个说法无数遍了。

当然,这个操作理论上是可行的。但如果真的在实践中应用所有相关的函数,光是第一层中的神经元数量就会多到不可思议。

对此,网友的评价是:收敛和等价证明被高估了,高效的学习策略被低估了,就是这样。

「我很高兴Python的存在,尽管Pascal是图灵完备的。」

一位从业者表示,自己的研究是从一个隐藏层MLP判别式开始,然后就是CNN或Deep NN等专业模型。

他的判断是:较小的模型更稳健、更可解释,而且通常很接近,但永远不会那么好。而使用更深层次的模型,总是会有额外的百分比。

很多人是「挺CoT派」的。比如有人表示理解LeCun的观点,但在多维扩展场景中,CoT绝对大有潜力。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

而对于LeCun所担心的问题,有网友表示,LeCun在采用一种自上而下的策略,在这种情况下他必须控制所有的第一层输入,但其实,他并不需要。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

因为,CoT通过创建了新的临时层,让人放弃了对这种控制的幻想。其解决方案就是,通过网络层的一般形式,来逼近注意力头本身。

有趣的是,该网友表示,自己的灵感来源是《物理学》上的一封信,表明量子全息拓扑能更有效地满足这一点。

即使爱因斯坦-罗森桥的边界相当大,它可以更连续地离散表示为无数不同的小层,横跨所产生的平坦空间。这,就是表征的力量所在。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

有人表示,这个讨论没什么意思,本质上不过是「无限猴子定理」罢了。

让一只猴子在打字机上随机按键,当按键时间达到无穷时,几乎必然能打出任何给定文字,比如莎士比亚全集。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

田渊栋:可以发展,但更复杂

最终,田渊栋也承认,谷歌这篇论文的思路的确有可取之处。然而由于涉及到不同的数据分布、模型架构、学习算法、后处理等等,问题还要更复杂。

正如Evolutionary Scale联创Zeming Lin所言:我们需要像乔姆斯基层次结构这样的机器学习模型。就像ML模型有NP、P、O(n^2) 等概念一样,Transformer或Mamba属于哪里呢?

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

而在田渊栋发帖的第二天,谷歌论文主要作者马腾宇也上线评论说:CoT的长度是可以超长的。

2层MLP中的神经元数量呈指数级,才能逼近几乎任何函数。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

田渊栋回复他说:对那些可能需要指数数量的门的问题,CoT的长度可以很长。

这和2层MLP情况是一致的,因为无论拟合任意函数,都需要覆盖高维空间中的所有角,这是最坏的情况。

然而,现实世界的问题,是否有如此良好/简洁的表征呢?如果它们都像NC1一样,属于P问题,那么当然可以通过构建Transformer的权重来做到。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

在最近一条X帖子中,田渊栋表示,自己的想法是,能够找到更短的CoT,同时使用专家迭代(穷人的RL)来保持最佳结果。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

从公开信息来看,他推断o1也是在做类似的事情。至于初始化过程,可能是使用了大量高质量的人类推理链。

人类是如何想出简洁的CoT呢,这就不为人所知了。

趁此机会,他还宣传了一下自己团队Searchformer的论文。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

论文地址:https://arxiv.org/abs/2402.14083

总之,虽然我们还不知道如何拓展2层神经网络,但OpenAI似乎确信自己已经掌握了拓展CoT的秘诀。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

最新讲座:揭示LLM推理的关键思想和局限

目前,这场空前热烈的讨论还在继续。

而关于LLM推理,Denny Zhou最近在UC伯克利也进行了一场类似主题的讲座。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

他表示,自己对AI的期待是可以像人类一样从较少的示例中进行学习。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

但曾经尝试的种种机器学习方法之所以都不成功,是因为模型缺失了一种重要能力——推理。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

人类之所以能从较少的示例中学习到抽象的规律和原理,就是因为推理能力。正如爱因斯坦所说的,「Make things as simple as possible but not simpler」。(一切都应该尽可能简单,但不能过于简单)

比如,对于下面这个问题:

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

对人类而言,这是一道小学水平的「找规律」。

但机器学习需要海量的标注数据才能找出其中的规律。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

而LLM的少样本学习更是难以解决。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

但如果在数据中加入「推理过程」,LLM就很容易有样学样,学习到少量样本示例中展现出的规律,并给出正确答案。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

通过这个简单的例子,Denny Zhou指出,关键想法是在数据中包含中间步骤,或者是解释原理(rationale),同时让模型写出推导过程。

这就是使用CoT背后的逻辑和直觉。

「中间步骤」,为何如此重要

DeepMind的研究者们,率先使用自然语言原理去解决数学问题。

关键就在于从头开始训练了一个序列到序列模型,从而通过一系列小步骤得出最终答案。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

继这项工作后,OpenAI的研究者们建立了一个更大的数学单词问题数据集(GSM8K),其中包含自然语言基本原理,并利用它对GPT-3进行了微调。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

这样,语言模型的中间计算步骤,就被展示了出来。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

o1模型的奠基性贡献者之一Jason Wei在谷歌大脑工作时曾和Denny Zhou发表了一篇论文,指出CoT提示可以引导出LLM的推理能力。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

Denny Zhou甚至更直白地指出样本「中间步骤」的重要性:无论是训练、微调还是提示,都需要给出中间步骤,才能让LLM在响应中也包含中间步骤。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

实际上,这也是Denny Zhou、马腾宇最近论文的核心观点。如果能生成足够长的中间推理步骤,常数深度的Transformer模型也能解决任何串行问题。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

CoT并不是一切

但是,这也并不意味着CoT可以包打一切,解决LLM推理的所有缺陷。

比如,模型很容易被无关的上下文干扰,这一点和人类思维也很类似。

实验中发现,在GSM8K数据集中添加无关上下文,可以导致模型性能出现高达20+百分点的损失。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

此外,LLM的自我纠正能力也并不健全。

虽然有些模型在反思后可以成功修改错误答案,但也存在另一种风险——可能反而把正确答案改错。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

那么,LLM的下一步应该往何处去?

Denny Zhou指出,虽然我们已经知道了模型推理有哪些缺陷和不足,但最重要的还是定义好问题,再从第一性原理出发去解决。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

此处,再引用一句爱因斯坦的话:「如果有1小时用来拯救星球,我会花59分钟来定义问题,然后用1分钟解决它。」

一些质疑

虽然Denny Zhou的演讲内容相当详实,但「CoT实现推理无极限」的论断确实相当大胆,因此也引起了网友的反驳。

比如有人指出,前提中所谓的「无限多token」只是在理论上可行,在实践中未必如此。

token数量很有可能随输入增加呈现指数增长,问题变得越来越复杂时,token数量逼近无限,你要怎么处理?

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

而且,LLM推理和人类还存在本质差异。AI目前只能进行暴力搜索(brute-force),但人类有所谓的「启发式」思考,「直觉」让我们能将数百万种可能性快速缩减至几种可行的解决方案。

Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对

如果想达到AGI,AI系统就需要模拟出这种高效的问题解决路径。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-21 11:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

连载12年,不愧是美剧天花板
12年,245集,两座艾美奖。这部改编自法庭人类学家凯丝·莱克斯同名小说的经典美剧。自2005年开播以来,以12季的超长篇幅,成为犯罪题材剧集中难以超越的经典。《识骨寻踪》故事围
2025-03-09 13:08:00
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...,也让生数科技立刻调整了战略。以往AI生成视频的长度天花板,是Runway Gen-3的18秒,如今Sora将天花板抬高到了60秒
2024-03-14 15:12:00
DeepSeek开源惠四方(科技名家笔谈)
...科学家伊利亚·苏茨克维等人甚至直言,规模法则已触及天花板。DeepSeek的出现,促使全球AI界严肃地思考这一技术发展路线问题:是继续烧钱豪赌,还是另辟蹊径,在算法优化上下更
2025-02-24 05:52:00
大江东|在首届浦江AI学术年会,感受人工智能加速跑
...云涌,能力一节高过一节,应用一浪超过一浪,不断突破天花板。”李萌简洁而细致地盘点了人工智能技术的快速进展:今年初,Sora惊艳登场,李飞飞的AI Agent和空间智能开创了认
2024-12-24 15:57:00
想做企业级智能体的「AutoAgents」,获数千万元天使轮融资 | 涌现好项目
...值链条中获取持续性收益,这能突破传统软件销售的营收天花板。• 企业软件正从“工具付费”转向“结果付费”,Agent 的核心价值在于服务结果导向,通过标准化的Agent产品和行
2025-03-11 05:56:00
具身智能如何再进化?庞江淼:“虚实贯通”将成推动机器人自主演进的可行路径
...大脑层面发展,核心挑战仍在于如何突破基础推理能力的天花板,实现从简单推理向中难度逻辑推导的认知跃升。“如果把A拿到B,它(机器人)其实知道怎么办。但是如果我把一个绿色的东西放
2025-02-26 14:49:00
打破发展“天花板” 壮大科创“她力量”
...支持政策,已经取得了良好效果。如果想彻底打破发展“天花板”,还要进一步推动社会观念的转变。对此,袁亚湘认为,应进一步加强宣传力度,提升公众的性别平等意识,消除社会对女性投身科
2024-01-15 01:46:00
人类计时器“天花板” 这种钟的误差可以达到3000亿年只差1秒
发现并归纳元素周期律的门捷列夫曾经说过,“科学是从测量开始的”,这句话的意思是说,没有精密测量就没有现代自然科学,而测量精度的提高往往会带来新的科学规律发现。门捷列夫,发现并归纳
2025-01-31 08:08:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...工智能(AGI)铺平道路? 数学一直被视为人类智力的“天花板”,数学家则不断在挑战人类智力的极限。同时,数学难题也一直是大模型难以“征服”的领域之一。数学是推理的语言。长期
2024-06-14 11:54:00
更多关于科技的资讯:
■程璐摘要:在高中英语学习中,词汇掌握质量直接影响阅读理解与表达能力。传统词汇教学多停留在机械记忆层面,学生难以形成稳定且可迁移的词汇表征
2026-01-07 04:52:00
江西如何跑稳“谷子经济”千亿赛道(图)
“‘谷子’不仅是Goods的谐音,对于我们来说,也是一种精神食粮。”刚从二手集市收摊的高中生小甜(化名)对“吃谷”这件事有着自己的理解
2026-01-07 04:52:00
喜旺春节礼盒上市!把年味与福气,一键打包带回家
辞暮尔尔,烟火年年。当街头的红灯笼渐渐挂起,当归家的车票开始抢订,藏在心底的年味也愈发浓烈。年,是团圆的相聚,是味蕾的盛宴
2026-01-07 05:00:00
烟台高新区:中关村烟台协同创新中心举办航空航天专场—烟台优质企业北京场景应用对接会
胶东在线1月5日讯(通讯员 郭健 实习编辑 单煜媛)近日,中关村·烟台协同创新中心联合烟台绿丞先进材料创新服务中心在北京举办烟台优质企业场景应用(航空航天专场)对接会
2026-01-07 05:00:00
河北新闻网讯(赵静静、陈立君)日前,开滦集团铁拓公司(简称“开滦铁拓公司”)自主研制出一台液压支架连杆焊接机器人,并在支护设备厂生产车间正式投入应用
2026-01-06 21:24:00
中新经纬1月6日电 据极目新闻报道,1月5日下午,三星电子会长李在镕现身北京京东MALL双井店购物。此前,李在镕出席了由中国贸促会
2026-01-06 21:31:00
江南时报讯 近日,第五届江苏资本市场峰会在南京召开。本次峰会围绕“聚合资本力量,助力产业创新”主题展开,通过多维度量化评价
2026-01-06 22:12:00
河北新闻网讯(闫丽颖、唐福刚)1月2日,在开滦股份范各庄矿井下600多米深处的三水平中央变电所,一位特殊的“新员工”——轨道式智能巡检机器人正式上岗
2026-01-06 21:35:00
1月6日,记者从盒马鲜生总部获悉,山西首店开业筹备已进入最后冲刺阶段。自7日起,线上配送服务陆续开启,这意味着以“盒区房生活”为代表的新零售方式正式步入太原人的生活日常
2026-01-06 20:06:00
2026成长新启示:张德芬《遇见未知的自己》解锁“爱你老己”,让自我陪伴成为终身底气
“亲爱的,外面没有别人,只有你自己。”张德芬在《遇见未知的自己》中写下的这句经典箴言,于2026年岁末年初再度引爆社交平台
2026-01-06 17:17:00
中国消费者报海口讯(记者董芳忠)近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发
2026-01-06 18:25:00
更名、AI巨头探访、股价大幅上涨,喜临门开门红!
近期,喜临门宣布更名“睡眠科技”,在资本市场与全球舆论场同步引发回响。国内市场方面,其股价稳步上扬并获资金持续买入,新年开盘第一个交易日打开涨停
2026-01-06 19:42:00
海尔三筒洗衣机越南热卖,夯实高端第一地位
海尔三筒洗衣机自10月登陆越南市场后,凭借独特设计与卓越性能迅速实现热卖。不仅赢得当地中产群体广泛认可,更推动在当地2000越南盾以上高端价位段实现0到13%的份额突破
2026-01-06 19:46:00
2026国家补贴已上线,河北廊坊消费者顺利签收省内冰箱国补首单
河北新闻网讯(记者 李春炜)2026年伊始,国家新一轮家电补贴政策于元旦起正式生效,各地消费者纷纷抓住机遇。其中,河北省廊坊市的王女士成为首批受益者
2026-01-06 17:06:00
乐佳善优品牌全指南:知名高端母婴营养品牌的成长与内核
乐佳善优,一个在中国母婴营养品领域深耕超过 16 年的知名品牌,凭借其 “专注营养,健康无忧”的核心理念,已成为众多中国家庭信赖的健康伙伴
2026-01-06 14:23:00