• 我的订阅
  • 科技

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

类别:科技 发布时间:2023-09-18 17:18:00 来源:量子位

梦晨 发自 凹非寺

量子位 | 公众号 QbitAI

谷歌PAIR团队不久前撰文介绍了AI的“领悟”(Grokking)现象——

训练久了突然不再死记硬背,而是学会举一反三,有了泛化能力。

不出一个月,另一只团队(主要成员来自DeepMind)表示,已经给出一个通用理论解释——

领悟又称延迟泛化,与AI内部两种“脑回路”的竞争有关。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

对此,有学者评价“我们需要更多这种对深度学习物理规律的研究,而不是去优化炼金术。”

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

AI的两种脑回路

在先前的研究中,发现在“领悟”现象的作用下,就算只有5-24个神经元的模型也能拥有泛化能力。

新研究沿用了这种构建最小示例,以及大量做可视化的方法。

基于OpenAI在2020年一项对神经网络内部机制之间相互作用的研究,团队假设并验证了模型内部有两种算法回路(Circuits)。

记忆回路Cmem,训练时表现很好,但测试时表现不佳。

泛化回路Cgen,训练和测试阶段表现都好。

通过改变数据集的大小和权重衰减的强度做实验来观察。

当训练数据集增大时,Cmem回路的参数范数也更大,也就是在靠记忆的方式去存储训练集需要的信息量。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

但Cgen的参数范数不随训练集大小变化,也就是获得了类似“举一反三”的泛化能力

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

那么,在什么条件下模型会发生整体的“领悟”现象呢?

来自两种回路的之间竞争。

在训练初期,直接死记硬背的速度更快,Cmem占据上风。

但随着数据的增加,在梯度下降的作用下效率更高的Cgen会被加强。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

也就是说,存在两种不同的回路、他们之间有效率差和学习速度差是导致领悟发生的三大要素。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

重新思考泛化

在更进一步的实验中,团队还根据这个理论成功演示了在一定条件下,已经“领悟”的模型也可以退化,出现“逆领悟”。

在新的小数据集上继续训练已领悟的模型时,测试精度突然变差,也就是在泛化之后的过拟合。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

也可以精心调整出一个“半领悟”状态。

当数据集的大小刚好在一个临界值,让Cmem和Cgen的效率相当,只对部分测试精度出现延迟泛化。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

团队认为,这种基于回路效率的分析为理解神经网络的泛化提供了一种新的视角。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

同时也提出了一些后续研究方向。

如为什么领悟所需的时间随数据集大小的减小呈超指数级增长?为什么Cgen回路的学习速度慢?为什么在没有权重衰减的情况下也会发生grokking?为什么在典型的机器学习训练中没有领悟现象?……

评论区有学者认为,研究这些基础问题并不需要成千上万块H100。

GPU贫民也有机会为整个领域做出贡献。

AI领悟有理论解释了!谷歌:两种脑回路内部竞争,不再死记硬背

论文地址:

https://arxiv.org/abs/2309.02390

参考链接:

[1]https://x.com/VikrantVarma_/status/1699823229307699305

[2]https://pair.withgoogle.com/explorables/grokking/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-18 21:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

天生桥局将培训融入日常故障处置提升核心竞争力
...培训机会,由经验丰富的站长组织开展。通过先集中讲授回路原理,再到现场对照分析理解的方式将缺陷故障处置分析与原理培训同步进行,经分析初步判断为测温回路中重要元器件PT100出现
2024-07-29 22:39:00
...从哪里来,到哪里去科学家揭示斑马鱼“自我定位”神经回路本报讯 幼体斑马鱼在被洋流推离航道后如何追踪自己的位置并导航呢?研究表明,斑马鱼幼鱼能够弄清它们在哪里、去过哪里,以及如
2023-01-04 06:00:00
多巴胺配色,为什么让人快乐?
...了,就会高兴。这个认知其实是有偏差的。多巴胺是奖赏回路的重要成分,与其说它的分泌与快乐有关,还不如说与人们“获得”时的惊喜有关。举个例子,比如爱情。当我们第一次见面时会在内心
2023-06-27 05:38:00
...赵俊海(音)博士。他说:“创伤事件发生后,前额记忆回路进行性增强,增强过程对恐惧记忆逐渐成熟、在大脑皮层中稳定下来形成永久性存储起到关键作用。通过类似的机制,其他非恐惧的久远
2023-01-29 19:55:00
峰回路转!曝图赫尔提留队条件,效仿哈维,3老将退出10亿欧豪门
拜仁本赛季只剩下最后一场比赛,而这场比赛的胜负并不会对他们的成绩造成太大的影响,图赫尔的球队已经没有了竞争联赛冠军的机会,斯图加特虽然还有竞争联赛第2的可能性,但是不会对拜仁的欧
2024-05-16 15:00:00
...等各方见证下,漳州核电“华龙一号”批量化首堆工程二回路联合水压试验圆满完成,这是继主给水管道冲洗合格、主蒸汽管道爆破吹扫完成后,二回路迎来的又一重大节点,为即将到来的冷态功能
2023-09-08 03:18:00
安科瑞智慧用电产品在金融业的应用与分析-安科瑞 周莉娜
...行数据只进行实时监测、预警。严禁监测设备侵入主用电回路,减少增加新的隐患点。2.4 安全可靠所有设备及施工均应由符合资质要求的公司和人员实施。监测系统应具有信息系统安全等级保
2023-01-31 09:00:00
果蝇脑细胞回路工作机理揭示
本文转自:科技日报将光波转为色彩体验果蝇脑细胞回路工作机理揭示研究人员在果蝇大脑中发现了能感知颜色的回路。图片来源:哥伦比亚大学祖克曼研究所科技日报北京5月17日电 (记者张梦然
2024-05-18 02:43:00
德国政客这脑回路,北溪竟然还和华为扯上了?
...据“politico.eu”获得的一份政府战略文件,德国此举的脑回路相当清奇,居然还扯上了“北溪”管道爆炸案一事。文件声称,德国对华为等中国设备停止依赖是为了“防止第二起北溪
2023-09-20 16:12:00
更多关于科技的资讯:
“车BA” 南京争霸
8月23日,“车BA”小米集团汽车部跨区域篮球争霸赛决赛在南京举行,来自北京、上海、武汉等地的7支参赛队伍齐聚古都南京,角逐冠军。 南京日报/紫金山新闻记者 段仁虎 摄
2025-08-24 09:50:00
“关不掉”的免密支付,肥了平台的钱包?
原标题| “关不掉”的免密支付,肥了平台的钱包?近日,话题“一定要关闭免密支付和自动扣款”冲上社交平台热搜,关于免密支付功能相关的讨论再次进入大众视野
2025-08-24 05:43:00
美国医疗巨头瞄准聚焦超声无创治疗赛道
近日,由美国医疗巨头强生等十余家机构组成财团,以22.5亿美元(约人民币161亿元)闪电收购了一家专注于“无创”超声波组织碎化技术(Histotripsy)的美国医疗科技公司HistoSonics多数股权
2025-08-24 07:02:00
家电业均价下滑!三翼鸟上海体验中心九成用户选高端
中国家电市场正经历均价下行的趋势。奥维云网数据显示,2025年第1周到第11周,空调、冰箱、洗衣机线上渠道均价同比分别下滑3
2025-08-23 08:20:00
在意大利:海尔空调销量TOP1
今夏,欧洲人经历了严酷“烤”验。八月初,受罕见热浪侵袭,意大利、法国等多国发布高温红色预警,西班牙南部气候飙升至46℃
2025-08-23 08:21:00
2025年,中国新材料产业总产值预计突破10万亿元,但在被列为“卡脖子”的多项关键材料中,国产化率不足30%。铝,作为全球产量第一
2025-08-23 08:22:00
单店年入过亿!三翼鸟上海体验中心是如何做到的?
当前,实体零售业正面临着变革与挑战,一方面,线上浪潮带来的冲击清晰可见:传统卖场客流锐减、部分门店面临关停挑战,《2025到店零售3
2025-08-23 08:22:00
省心比省钱重要!三翼鸟上海体验中心8成用户定制场景
当前,消费者在居家领域的决策逻辑正经历深刻变革。过往,性价比常是左右消费者选购家电、家居产品的核心要素,而如今,“省心”已逐渐攀升至决策考量的优先位置
2025-08-23 08:23:00
8月23日19:00,“河北五超”承德vs保定,最硬核的主场,承德“硬核宠粉”现场抽奖送钻石!
2025-08-23 08:53:00
厦门网讯(厦门日报记者 李晓平)日前,《财富》中国科技50强榜单出炉,华为投资控股有限公司、DeepSeek(深度求索)
2025-08-23 09:00:00
厦门网讯(厦门日报记者 李晓平)昨日下午,“智汇鹭岛,AI赋能总部经济新生态”对接会在九牧创新中心举行,聚焦鞋服、卫浴等我市优势产业
2025-08-23 09:00:00
南京火车站网约车候客区升级后,“人车互找”成过往超省心!一屏锁定车在哪,网约乘车更“丝滑”□南京日报/紫金山新闻记者吴春霞 通讯员宁交宣“家人们
2025-08-23 09:52:00
落实全省数字经济发展推进大会见行动|中国科学院与贵州大数据集团共办技术交流会共探数字化发展新路径
8月21日,中国科学院与贵州大数据集团在贵阳联合举办技术交流会。来自中国科学院信息工程研究所、中国科学院软件研究所、阿里云
2025-08-23 12:00:00
《像大师那样写作》:给所有写作者的“逆袭指南”
你是否曾感到写作之路迷雾重重?是否曾因屡屡退稿而怀疑自己缺乏“天赋”?一本刚刚问世的新书,或许能彻底改变你的写作命运——《像大师那样写作
2025-08-23 12:27:00
鸿蒙5.1网络数据安全管理能力再加强,华为浏览器守护用户隐私保护防线
2025年,中国网络安全领域呈现“监管强化”与“威胁升级”的双重态势。国家相关部门陆续落地施行《网络数据安全管理条例》等
2025-08-23 13:03:00