• 我的订阅
  • 科技

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

类别:科技 发布时间:2024-09-21 09:36:00 来源:量子位

“o1发布后,一个新的范式产生了”。

其中关键,OpenAI研究科学家、o1核心贡献者Hyung Won Chung,刚刚就此分享了他在MIT的一次演讲。

演讲主题为“Don’t teach. Incentivize(不要教,要激励),核心观点是:

激励AI自我学习比试图教会AI每一项具体任务更重要

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

思维链作者Jason Wei迅速赶来打call:

Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底,他意识到了强化学习的力量,并从那时起就一直在宣扬它。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

在演讲中,Hyung Won还分享了:

技术人员过于关注问题解决本身,但更重要的是发现重大问题 硬件进步呈指数级增长,软件和算法需要跟上; 当前存在一个误区,即人们正在试图让AI学会像人类一样思考 “仅仅扩展规模” 往往在长期内更有效

下面奉上演讲主要内容。

对待AI:授人以鱼不如授人以渔

先简单介绍下Hyung Won Chung,从公布的o1背后人员名单来看,他属于推理研究的基础贡献者。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

资料显示,他是MIT博士(方向为可再生能源和能源系统),去年2月加入OpenAI担任研究科学家。

加入OpenAI之前,他在Google Brain负责大语言模型的预训练、指令微调、推理、多语言、训练基础设施等。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

在谷歌工作期间,曾以一作身份,发表了关于模型微调的论文。(思维链作者Jason Wei同为一作)

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

回到正题。在MIT的演讲中,他首先提到:

通往AGI唯一可行的方法是激励模型,使通用技能出现。

在他看来,AI领域正处于一次范式转变,即从传统的直接教授技能转向激励模型自我学习和发展通用技能。

理由也很直观,AGI所包含的技能太多了,无法一一学习。(主打以不变应万变)

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

具体咋激励呢??

他以下一个token预测为例,说明了这种弱激励结构如何通过大规模多任务学习,鼓励模型学习解决数万亿个任务的通用技能,而不是单独解决每个任务。

他观察到:

如果尝试以尽可能少的努力解决数十个任务,那么单独模式识别每个任务可能是最简单的;如果尝试解决数万亿个任务,通过学习通用技能(例如语言、推理等)可能会更容易解决它们。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

对此他打了个比方,“授人以鱼不如授人以渔”,用一种基于激励的方法来解决任务。

Teach him the taste of fish and make him hungry.(教AI尝尝鱼的味道,让他饿一下)

然后AI就会自己出去钓鱼,在此过程中,AI将学习其他技能,例如耐心、学习阅读天气、了解鱼等。

其中一些技能是通用的,可以应用于其他任务。

面对这一“循循善诱”的过程,也许有人认为还不如直接教来得快。

但在Hyung Won看来:

对于人类来说确实如此,但是对于机器来说,我们可以提供更多的计算来缩短时间。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

换句话说,面对有限的时间,人类也许还要在专家 or 通才之间做选择,但对于机器来说,算力就能出奇迹。

他又举例说明,《龙珠》里有一个设定:在特殊训练场所,角色能在外界感觉只是一天的时间内获得一年的修炼效果。

对于机器来说,这个感知差值要高得多。因此,具有更多计算能力的强大通才通常比专家更擅长特殊领域。

原因也众所周知,大型通用模型能够通过大规模的训练和学习,快速适应和掌握新的任务和领域,而不需要从头开始训练。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

他还补充道,数据显示计算能力大约每5年提高10倍。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

总结下来,Hyung Won认为核心在于:

模型的可扩展性 算力对加速模型进化至关重要

此外,他还认为当前存在一个误区,即人们正在试图让AI学会像人类一样思考。

但问题是,我们并不知道自己在神经元层面是如何思考的。

机器应该有更多的自主性来选择如何学习,而不是被限制在人类理解的数学语言和结构中。

在他看来,一个系统或算法过于依赖人为设定的规则和结构,那么它可能难以适应新的、未预见的情况或数据。

造成的结果就是,面对更大规模或更复杂的问题时,其扩展能力将会受限。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

回顾AI过去70年的发展,他总结道:

AI的进步与减少人为结构、增加数据和计算能力息息相关。

与此同时,面对当前人们对scaling Law的质疑,即认为仅仅扩大计算规模可能被认为不够科学或有趣。

Hyung Won的看法是:

在扩展一个系统或模型的过程中,我们需要找出那些阻碍扩展的假设或限制条件。

举个例子,在机器学习中,一个模型可能在小数据集上表现良好,但是当数据量增加时,模型的性能可能会下降,或者训练时间会变得不可接受。

这时,可能需要改进算法,优化数据处理流程,或者改变模型结构,以适应更大的数据量和更复杂的任务。

也就是说,一旦识别出瓶颈,就需要通过创新和改进来替换这些假设,以便模型或系统能够在更大的规模上有效运行。

训练VS推理:效果相似,推理成本却便宜1000亿倍

除了上述,o1另一核心作者Noam Brown也分享了一个观点:

训练和推理对模型性能提升作用相似,但后者成本更低,便宜1000亿倍。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

这意味着,在模型开发过程中,训练阶段的资源消耗非常巨大,而实际使用模型进行推理时的成本则相对较低。

有人认为这凸显了未来模型优化的潜力。

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

不过也有人对此持怀疑态度,认为二者压根没法拿来对比。

这是一个奇怪的比较。一个是边际成本,另一个是固定成本。这就像说实体店比其中出售的商品贵500000倍

o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要

对此,你怎么看?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-21 11:45:04

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...任务就是帮学生建立“百分数解题策略”这个模型工具,教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景,把百分数的问题嵌入其中,让学生自主辨析要用哪个模型工具去解决遇到的
2024-03-14 11:03:00
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...代表解决问题的步骤。GATO 由DeepMind开发,基于强化学习教会大模型完成600多个不同的任务,包含离散控制如Atari小游戏
2023-01-30 16:34:00
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程,而是逐步地解决问题
2024-03-15 10:41:00
Meta联合开发机器人AI模型,任务成功率达90%
...·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人(来源
2024-09-23 10:02:00
...焦点是“小样本概念学习”,这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释:“这是一种‘举一反
2024-04-29 06:24:00
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛
2024-11-28 09:59:00
...作用。充分发挥“影子教师”的作用,让学生当小先生,教会别人提升自己,每个班级根据情况每学科设置1—2 人。开展“结对互助”活动,班主任根据学生情况科学设置,两两结对帮扶,互相
2024-02-29 09:43:00
数字化转型究竟给基础教育带来什么?
...境下解决实际问题的能力。从这一点上来看,恰如其分地教会学生如何使用技术工具,是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”,并不单纯指电脑等实体工具,大模型、文
2024-02-27 06:22:00
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...。科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展
2024-09-26 13:35:00
更多关于科技的资讯:
日销350万!“湖北淘宝第一村”电商直播业绩喜人
电商搭台,产业唱戏。11月11日,在“湖北淘宝第一村”郧西县涧池乡下营村,各大电商企业与网络主播火力全开,创下日销超350万元的好成绩
2025-11-12 19:50:00
河钢张宣科技上月节约外购电成本超670万元
河北新闻网讯(马薇)近日,笔者获悉,河钢集团张宣科技紧扣“决胜四季度,实现双提升”目标,以构建多元化、清洁化发电体系为核心
2025-11-12 16:54:00
在金融业迈向高质量发展新阶段的当下,客户的需求正从“获得金融服务”向“享受金融美好”转变。银行业如何摆脱同质化竞争,真正扎根区域
2025-11-12 15:24:00
“数”智金融・龙泉“量”剑 中州龙泉期货数智平台3.0重磅发布
在数字经济深度赋能资本市场的时代浪潮中,为积极响应证监会金融“五篇大文章”战略部署,2025年11月7日,“数”智金融・龙泉“量”剑——中州龙泉期货数智平台3
2025-11-12 12:56:00
梅特勒托利多 2025 进博会首秀圆满落幕,国产化成果引多方聚焦
为期六天的 2025 年中国国际进口博览会正式落下帷幕,全球精密仪器领军者梅特勒托利多首次参展便交出亮眼答卷。作为受临港政府邀请的重点企业
2025-11-12 12:56:00
高途公考2026年线上事业单位产品发布会盛大召开!
2026年11月5日,高途公考以“豫见高途,事启新程”为主题,召开线上事业单位产品发布会。在就业市场从“学历提升”向“稳定就业”转型的背景下
2025-11-12 12:54:00
中亦科技入选北京市“诚信兴商”倡议企业
近日,由北京市商务局主办的2025年“诚信兴商”北京主题日活动暨第十四届北京企业诚信论坛在京隆重举行。本次活动旨在弘扬诚信经营理念
2025-11-12 11:45:00
南报网讯(记者卫凌云通讯员建萱)11月11日,京东集团成功竞得NO.宁2025Y05地块,京东集团南京研发中心正式落户建邺
2025-11-12 08:05:00
南报网讯(记者张安琪)11月11日下午,2025年“江苏省成果(专利)拍卖季”软件与信息服务产业专场活动在江宁开发区大数据中心举办
2025-11-12 08:06:00
红山路商业综合体打造“年轻力”潮流集中地
11月10日,红山路红山Sparkle耀市开启试运行,首批餐饮店、发廊、健身房等已开业。该项目为铁北红山国际社区商业部分
2025-11-12 08:06:00
2025年11月,“我在IT分销领域深耕三十多年,从诺基亚时代、摩托罗拉、苹果手机到笔记本、算力服务器,见过无数款软硬件产品
2025-11-11 14:38:00
同舟致远•共赢新程 泰凯英上市启航仪式在青岛隆重举行
11月7日,青岛泰凯英专用轮胎股份有限公司在青岛市崂山区成功举行"同舟致远•共赢新程"上市启航仪式。崂山区政府、青岛市上市公司协会
2025-11-11 14:49:00
旅美博士青年钢琴家周海天:在理性与证据中寻找音乐之美
近年来,越来越多青年钢琴赛事在亚洲和北美活跃展开,一批具有国际视野与学术背景的青年评委逐渐走入公众视野。一位拥有中、英
2025-11-11 14:49:00
在中国,为中国 Brother第八届进博会迎收官,多元打印服务受关注
11月10日,第八届中国国际进口博览会(以下简称"进博会")即将盛大落幕。全球知名制造厂商Brother以"In China
2025-11-11 15:20:00
Hape坚守对全球消费者承诺,积极布局供应链保障产品质量与供应
在接受《福布斯》(Forbes)杂志采访时,Hape集团创始人兼总裁Peter Handstein先生表示,目前整个玩具行业正经历一场"过山车"般的考验
2025-11-11 15:20:00