• 我的订阅
  • 科技

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

类别:科技 发布时间:2023-09-18 17:18:00 来源:量子位

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌PAIR团队不久前撰文介绍了AI的“领悟”(Grokking)现象——

训练久了突然不再死记硬背,而是学会举一反三,有了泛化能力。

不出一个月,另一只团队(主要成员来自DeepMind)表示,已经给出一个通用理论解释——

领悟又称延迟泛化,与AI内部两种“脑回路”的竞争有关。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

对此,有学者评价“我们需要更多这种对深度学习物理规律的研究,而不是去优化炼金术。”

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

AI的两种脑回路

在先前的研究中,发现在“领悟”现象的作用下,就算只有5-24个神经元的模型也能拥有泛化能力。

新研究沿用了这种构建最小示例,以及大量做可视化的方法。

基于OpenAI在2020年一项对神经网络内部机制之间相互作用的研究,团队假设并验证了模型内部有两种算法回路(Circuits)。

记忆回路Cmem,训练时表现很好,但测试时表现不佳。

泛化回路Cgen,训练和测试阶段表现都好。

通过改变数据集的大小和权重衰减的强度做实验来观察。

当训练数据集增大时,Cmem回路的参数范数也更大,也就是在靠记忆的方式去存储训练集需要的信息量。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

但Cgen的参数范数不随训练集大小变化,也就是获得了类似“举一反三”的泛化能力

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

那么,在什么条件下模型会发生整体的“领悟”现象呢?

来自两种回路的之间竞争。

在训练初期,直接死记硬背的速度更快,Cmem占据上风。

但随着数据的增加,在梯度下降的作用下效率更高的Cgen会被加强。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

也就是说,存在两种不同的回路、他们之间有效率差和学习速度差是导致领悟发生的三大要素。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

重新思考泛化

在更进一步的实验中,团队还根据这个理论成功演示了在一定条件下,已经“领悟”的模型也可以退化,出现“逆领悟”。

在新的小数据集上继续训练已领悟的模型时,测试精度突然变差,也就是在泛化之后的过拟合。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

也可以精心调整出一个“半领悟”状态。

当数据集的大小刚好在一个临界值,让Cmem和Cgen的效率相当,只对部分测试精度出现延迟泛化。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

团队认为,这种基于回路效率的分析为理解神经网络的泛化提供了一种新的视角。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

同时也提出了一些后续研究方向。

如为什么领悟所需的时间随数据集大小的减小呈超指数级增长?为什么Cgen回路的学习速度慢?为什么在没有权重衰减的情况下也会发生grokking?为什么在典型的机器学习训练中没有领悟现象?……

评论区有学者认为,研究这些基础问题并不需要成千上万块H100。

GPU贫民也有机会为整个领域做出贡献。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

论文地址:

https://arxiv.org/abs/2309.02390

参考链接:

[1]https://x.com/VikrantVarma_/status/1699823229307699305

[2]https://pair.withgoogle.com/explorables/grokking/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-18 21:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

天生桥局将培训融入日常故障处置提升核心竞争力
...培训机会,由经验丰富的站长组织开展。通过先集中讲授回路原理,再到现场对照分析理解的方式将缺陷故障处置分析与原理培训同步进行,经分析初步判断为测温回路中重要元器件PT100出现
2024-07-29 22:39:00
数控车床液压尾座系统搭建与调试教学设计
...“真实工业任务”为导向,遵循“功能确定—元件选择—回路设计—回路连接—回路调试”的典型工作流程,融入职业规范与安全操作意识,构建“理实一体化”教学体系,助力学生实现从理论认知
2025-09-26 19:28:00
...从哪里来,到哪里去科学家揭示斑马鱼“自我定位”神经回路本报讯 幼体斑马鱼在被洋流推离航道后如何追踪自己的位置并导航呢?研究表明,斑马鱼幼鱼能够弄清它们在哪里、去过哪里,以及如
2023-01-04 06:00:00
多巴胺配色,为什么让人快乐?
...了,就会高兴。这个认知其实是有偏差的。多巴胺是奖赏回路的重要成分,与其说它的分泌与快乐有关,还不如说与人们“获得”时的惊喜有关。举个例子,比如爱情。当我们第一次见面时会在内心
2023-06-27 05:38:00
...赵俊海(音)博士。他说:“创伤事件发生后,前额记忆回路进行性增强,增强过程对恐惧记忆逐渐成熟、在大脑皮层中稳定下来形成永久性存储起到关键作用。通过类似的机制,其他非恐惧的久远
2023-01-29 19:55:00
峰回路转!曝图赫尔提留队条件,效仿哈维,3老将退出10亿欧豪门
拜仁本赛季只剩下最后一场比赛,而这场比赛的胜负并不会对他们的成绩造成太大的影响,图赫尔的球队已经没有了竞争联赛冠军的机会,斯图加特虽然还有竞争联赛第2的可能性,但是不会对拜仁的欧
2024-05-16 15:00:00
...等各方见证下,漳州核电“华龙一号”批量化首堆工程二回路联合水压试验圆满完成,这是继主给水管道冲洗合格、主蒸汽管道爆破吹扫完成后,二回路迎来的又一重大节点,为即将到来的冷态功能
2023-09-08 03:18:00
安科瑞智慧用电产品在金融业的应用与分析-安科瑞 周莉娜
...行数据只进行实时监测、预警。严禁监测设备侵入主用电回路,减少增加新的隐患点。2.4 安全可靠所有设备及施工均应由符合资质要求的公司和人员实施。监测系统应具有信息系统安全等级保
2023-01-31 09:00:00
果蝇脑细胞回路工作机理揭示
本文转自:科技日报将光波转为色彩体验果蝇脑细胞回路工作机理揭示研究人员在果蝇大脑中发现了能感知颜色的回路。图片来源:哥伦比亚大学祖克曼研究所科技日报北京5月17日电 (记者张梦然
2024-05-18 02:43:00
更多关于科技的资讯:
主人尚未开口,家已知道他要归来?这不是魔法,是海尔在AWE 2026呈现的“空间智能”。从离家一键备车到归途远程控家,从孩子社区动态到漏水自动报警
2026-03-15 23:14:00
市场监管总局:去年消费者投诉举报呈现十大特点
中国网3月16日讯 据市说新语微信公众号消息,2025年,全国市场监管部门通过全国12315平台、电话等渠道共受理消费者投诉
2026-03-16 00:59:00
为期三天的“浙里买全球·消费启杭”活动汇聚了来自全球各地的特色商品,活动会为消费者带来怎样的全新体验?走进展区,仿佛开启了一场环球之旅
2026-03-15 20:52:00
全国两会结束后的第一个周末,金华迎来了一群特殊的客人。据《金华日报》报道,3月14日,商务部党组书记、部长王文涛率队来我市调研对外贸易
2026-03-15 20:52:00
中新经纬3月15日电 “中国互联网金融协会”公众号15日发布关于OpenClaw在互联网金融行业应用安全的风险提示。近期
2026-03-15 21:30:00
在AWE2026海尔展区,五大套系呈现了智能家电的不同探索路径:Seeker套系以L4级AI智能体实现主动感知,小红花套系面向年轻群体聚焦极简交互
2026-03-15 18:40:00
3月9日至10日,滦州农商银行举办业务拓展与营销技能提升专题培训。本次培训采取“理论授课+实战走访”模式,机关部室负责人
2026-03-15 18:45:00
今年以来,肥乡联社将线上贷款营销作为零售贷款增户扩面、信贷结构调整优化的切入点,强化督导考核,加强营销培训,丰富信贷产品
2026-03-15 18:54:00
小叶医探 | 手术机器人“学院派”来了!安医大医用机器人产业学院正式启航
大皖新闻讯 3月15日,一所由政府、高校、行业、企业四方协同共建的创新型学院——医用机器人产业学院,在安徽医科大学正式揭牌启航
2026-03-15 19:18:00
“沧州造”高性能膜开年斩获千万元海外订单
2026-03-15 18:47:00
长白时评评论员 刘颂寒又是一年春草绿,又是一年“3·15”时。每年的 ‌“3·15晚会”‌,必然是不少商家坐立难安的时刻
2026-03-15 08:16:00
近日,从山西转型综改示范区传来好消息,山西中电科电子装备有限公司市场开拓捷报频传,碳化硅涂层设备、纯化设备、铜铸锭炉等订单接连落地
2026-03-15 07:11:00
14日,“金华·金漪湖”2026人工智能产业融合发展大会在金义新区举行。今年全国两会上,政府工作报告提出“打造智能经济新形态”
2026-03-15 07:41:00
杭州创新力量表现抢眼杭州日报讯 3月12日,国家服务贸易创新发展引导基金二期的首场项目路演会在杭州举行。22个来自数字贸易
2026-03-15 07:42:00