• 我的订阅
  • 科技

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

类别:科技 发布时间:2024-03-01 09:36:00 来源:DeepTech深科技

近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。

借助这一方法可以大幅提升小模型的性能表现,从而让小模型在各种应用场景中更具竞争力。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 李志宇(来源:李志宇)

在当前的大模型研究与产业化实践中,存在把模型“做大”和把模型“做小”这两个方向。

前者致力于达成超大的参数规模,往往达到千亿左右;后者致力于实现较少的参数规模,往往多为十亿左右。

“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。

情景学习(ICL,In-context Learning), 是大语言模型能力的一个重要体现。

近期,有关大模型的情景学习机制和原理的相关研究,已经成为大模型的一个热门的方向。

前不久,在多个计算机人工智能顶会上,有关情景学习的研究内容均被热烈讨论。

情景学习的通常做法是:给到大模型一些示例和相应回答,然后大模型就能推断出下一个未知问题的答案。

比如将“我爱你”和“我恨你”这两个例子给到大模型。“我爱你”的标签是“积极”,“我恨你”的标签是“消极”。

那么,当你对大模型表示“我喜欢今天的阳光”,大模型大概率就能推断出“积极”的标签。

目前,针对情景学习的主要研究方向包括:示例筛选方法、示例顺序方法、示例结构方法、以及示例标签分布方法。

但是,这些方法的局限在于:仍在通过选择更好的示例、以及通过选择示例的呈现形式,来帮助大模型更好地从示例学习中掌握解决问题的方法。

那么,如何降低大模型的学习难度?即如何让大模型无需通过示例这一媒介,就能直接获取解决下游任务的方法?

一般来说,大模型的参数规模越大,情景学习能力也就越强。然而,当参数规模扩大的时候,算力要求也就越来越高,训练开销和推理开销也会急剧增长。

这些急剧增长的算力要求限制了大模型的应用场景,以至于很难将其在手机端进行部署。

随着大模型参数规模的逐渐增大,对于计算成本和存储成本的消耗也随之增加。尤其是 GPT-4 或千亿以上参数级的超级大模型,训练成本相当高昂。

因此,目前的研究方向之一便是:如何针对模型进行高效压缩,以便在加速推理的同时保持效果。若能将模型进行压缩,还能降低其推理成本,甚至让其与购买运行模型的端侧设备成本相当。

近期,已有不少研究致力于开发小规模、低算力需求的模型,并取得了一定成果。

2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的研究与应用。

这一系列小规模参数模型的发布,也表明大模型研发逐渐从“做大”转移到“做小”,且呈现出 N 个⼤模型 K 个小模型,同时 N << K 的现象。

所以,如何让小模型保持高效率的同时,提高其下游任务的性能,成为一个重要的方向。

基于此,人们也在探索如何让小参数模型的能力,能够媲美大参数模型。

另一方面,在目前的情景学习方法之中,通常需要针对每个测试问题进行一次示例筛选,无法针对某一个下游问题形成通用的“演示内容”,从而达到一劳永逸的效果。

以人类学习为例,在获得一些示例之后:其一,我们不仅可以直接通过找出规律,推测出来给定问题的标签。其二,还可以针对示例进行研究,从而形成一套更加抽象、更加通用的解题法则。

而第二种方法更加具备普适性和稳定性,也是广受认可的一种学习方法。以处理情感分类任务为例,人类能够总结一些通用的解题法则。

比如当我们在学习一些表达情绪的关键词时,就要关注否定词对于原始情感的反转。

而在本次研究之中,李志宇等人通过实验发现:基于能力较强的大模型,可以总结出来一些技能经验,他们将其称之为魔法书(Grimoire)。

而当把这些技能经验传递给能力较弱的大模型,则能显著提高能力较弱的大模型在下游任务上的表现。甚至对于部分小模型而言,通过学习 Grimoire,它们在一些任务上的性能表现甚至超过 GPT-4。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 模型原理示意图(来源:arXiv)

整体来说:

对于大模型的情景学习来说,该团队提供了一个全新的视角,帮助大模型针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。

对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 学习魔法书的小孩(来源:DALL-E 生成)

如果说之前的 AI 研究是以月为单位来计算,那么在大模型时代则是以周为单位来计算。各类 AI 技术“日新周异”,在这种高速创新的环境压强之下,也给大模型时代的从业者提出了更大的挑战。

研究伊始,李志宇和同事希望借助于模型的自我纠正来提升小模型的表现。但是,随着实验的进展他们发现受限于小模型自身的推理能力和理解能力,导致很难获得有效的提升。

正当一筹莫展之时,他们无意间看到了一则朋友圈。发这则朋友圈的人是一名家长,其分享了关于“学霸笔记”的内容。

这让他们瞬间顿悟:既然小模型的推理和总结能力比较弱,那么为什么不能让强模型(学霸)去总结经验(魔法书),然后将经验传授给小模型(学弱)?

上述想法一经提出,立马获得组内其他成员的一致赞同,于是李志宇等人迅速开展模型设计和模型实验。

“当发现最终效果超过预期之后,我们不得不感叹:科研源自生活!”李志宇表示。

日前,相关论文以《增强大型语言模型所需的全部内容就是魔法书》(Grimoire is All You Need for Enhancing Large Language Models)为题发在 arXiv[1]。

陈鼎是第一作者,李志宇担任通讯作者。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 相关论文(来源:arXiv)

此外,在本次论文发布一个月左右,来自美国加州大学伯克利分校、美国卡内基梅隆大学和 DeepMind 公司组成的研究团队,发表了一篇类似的论文[2]。

李志宇表示:“同行的这篇论文和我们的思路如出一辙,他们提出的方法正是我们所提出方法中第一个阶段样本筛选中的其中一种,即困难样本筛选。同行提出的方法,更像是我们所提出的方案的一个子集,这为我们的后续研究增强了信心。”

目前,李志宇和同事提出的新型情景学习方法,旨在通过“强模型”基于代表性示例样本生成 Grimoire,从而提升“弱模型”在下游任务上的表现。

未来,他们打算训练一个专门生成 Grimoire 的大模型,从而保证 Grimoire 生成的稳定性和可控性。

同时,也将基于小模型的任务描述和现有示例等信息,生成代表性的示例样本。这样一来,就不需要遍历训练集进行筛选,而是可以通过专门的小模型,来生成特定的代表性样本。

不仅能让样本更具有针对性,也能保证代表性样本的稳定性,同时还能避免对于训练集样本的依赖。

届时,通过输入测试样例的少量信息,即可生成几个示例样本,以此作为提示下游模型完成任务的上下文学习示例,从而大幅增强下游模型的性能表现。

假如这些后续研究能够顺利完成,将能更大程度地提升小模型的能力,从而为产业化落地提供更多支持。

参考资料:

1.https://arxiv.org/abs/2401.03385

2.http://export.arxiv.org/abs/2402.05403

运营/排版:何晨龙

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-01 12:45:35

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...么样的?早期,人们普遍认为,科学发展是循序渐进的,科学家不断涌现,将已有科学理论向前推进从而推动科学发现越来越接近真理。1962年,美国学者托马斯·库恩在《科学革命的结构》一
2023-01-19 11:33:00
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来
2024-03-12 10:59:00
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...。未来已来,我们正在见证科学范式变革,而这次,中国科学家站在了浪潮之巅。
2025-03-21 16:54:00
王坚院士最新发声:人类已进入计算范式时代,AI将成为科学革命的工具
...颁发给了在人工智能与基础科学交叉领域实现重大突破的科学家,不难窥见人工智能在科学研究中越来越重要的分量。王坚院士还特别提到了DeepSeek这种具有代表性的AI工具
2025-02-21 16:11:00
国内成立首个超级智能安全实验室
...动化研究所,由人民中科等单位共同建设,人民中科首席科学家担任实验室主任。多模态超级智能安全北京市重点实验室在中关村论坛上正式对外公开。中关村论坛供图北京市重点实验室作为北京市
2025-03-31 11:35:00
陆奇:未来大模型无处不在,是技术世界中的全新物种
...大模型都可以做到。而这个时代的典型职业将是创业者、科学家和艺术家。5月7日,陆奇在北京举行了一场超千人规模、主题为《新范式 新时代 新机会》的演讲,全程超三个小时。他就当前最
2023-05-15 13:00:00
科学研究范式已经变革!专家对科学引领智能变革这样说|世界顶尖科学家论坛
...面新闻记者 车家竹 上海报道11月7日,上海临港世界顶尖科学家论坛潮悦堂内,世界各国科学家一道讨论“科学引领智能变革—人工智能向善 共筑人类福祉”,顶尖科学家一同探索充满魅力
2023-11-08 17:05:00
第五范式迎面来,AI向善很关键
本文转自:解放日报多国科学家就人工智能驱动的科研变革提出真知灼见第五范式迎面来,AI向善很关键顾泳世界顶尖科学家碳大会现场。 本报记者 顾泳推动科学研究从“马拉松”到“加速跑”,
2023-11-08 06:44:00
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...可以快速、准确地将该药物会带来的影响一五一十地告诉科学家,那么必将极大降低科研人员的时间成本、以及相关厂商的资源成本,为更快、更精确地发现药物提供助力。前不久,中国科学技术大
2024-03-07 10:44:00
更多关于科技的资讯:
近年来,音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用,使行业内部出现了关于“声音设计是否需要标准化
2026-01-09 14:49:00
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00
OPC“最强大脑”集结 高德空间智能开发者大赛全国总决赛在苏州落幕
江南时报讯 “‘智能遛狗小助手’帮你制定更合理的遛狗计划。”“出门旅游,帮你一站式行程管理。”“无障碍出行,AI轻松识别障碍物
2026-01-11 16:26:00
合肥创新院举办“汽车+”产业科创企业路演
大皖新闻讯 为搭建产业与资本的高效对接桥梁,推动汽车科技创新成果转化,助力创新创业企业成长,近日,2026“汽车+”产业科创企业新年路演在合肥创新院举办
2026-01-11 16:52:00
在吉林,机器人也开始“卷”滑雪了!
当双足机器人蹒跚滑下雪道,当机械臂在-20℃寒风中精准投出雪球……这些充满未来感的画面,如今正在吉林的冰天雪地里真实上演
2026-01-11 15:05:00
中新经纬1月11日电 国家医保局网站11日发布《国家医疗保障局办公室关于开展个人医保云建设试点申报工作的通知》(以下简称《通知》
2026-01-11 12:46:00
都市快报讯 昨天上午,上城区同协路旁的西子智慧产业园迎来了一名特殊的“保安”——身高1.8米,通体银色金属光泽,走起路来
2026-01-11 08:22:00
人形机器人“入职”前的试炼场来了杭州日报讯 核心提示2025年被称为人形机器人量产元年,今年人形机器人步入量产关键期,如何让机器人理解并适应人类真实的世界
2026-01-11 08:22:00
河北新闻网讯(崔梦露)1月8日下午,平安产险唐山中心支公司通过抖音、微信视频号、平安好车主、平安好生活等四大线上平台,举办“开年迎好运家家有平安”直播活动
2026-01-09 21:11:00
在全球制造业向高质量升级的浪潮下,超高压技术正成为破解多行业性能瓶颈的关键支撑。作为全球超高压领域标杆企业,Quintus专注于超高压技术的研发与应用
2026-01-10 20:59:00
为规范互联网应用程序个人信息收集使用活动,保护个人信息权益,促进个人信息合理利用,根据《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《网络数据安全管理条例》等法律法规
2026-01-10 21:56:00
浙江造,红遍中国年!万事利春晚红围巾成“新年硬通货”
随着2026马年临近,一条承载马年春晚吉祥寓意的红围巾,正成为年末备受瞩目的新春佳礼。作为总台文创官方合作品牌,万事利丝绸匠心推出的“骐骥驰骋”系列围巾与丝巾
2026-01-10 21:02:00