• 我的订阅
  • 科技

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

类别:科技 发布时间:2024-03-01 09:36:00 来源:DeepTech深科技

近日,上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL),能更好地加速小模型的学术研究和产业落地。

借助这一方法可以大幅提升小模型的性能表现,从而让小模型在各种应用场景中更具竞争力。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 李志宇(来源:李志宇)

在当前的大模型研究与产业化实践中,存在把模型“做大”和把模型“做小”这两个方向。

前者致力于达成超大的参数规模,往往达到千亿左右;后者致力于实现较少的参数规模,往往多为十亿左右。

“做大”,能让大模型具备更强的涌现能力和推理能力,从而适用于难度更高的任务。“做小”,能让大模型获得更优秀的推理能力,从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。

情景学习(ICL,In-context Learning), 是大语言模型能力的一个重要体现。

近期,有关大模型的情景学习机制和原理的相关研究,已经成为大模型的一个热门的方向。

前不久,在多个计算机人工智能顶会上,有关情景学习的研究内容均被热烈讨论。

情景学习的通常做法是:给到大模型一些示例和相应回答,然后大模型就能推断出下一个未知问题的答案。

比如将“我爱你”和“我恨你”这两个例子给到大模型。“我爱你”的标签是“积极”,“我恨你”的标签是“消极”。

那么,当你对大模型表示“我喜欢今天的阳光”,大模型大概率就能推断出“积极”的标签。

目前,针对情景学习的主要研究方向包括:示例筛选方法、示例顺序方法、示例结构方法、以及示例标签分布方法。

但是,这些方法的局限在于:仍在通过选择更好的示例、以及通过选择示例的呈现形式,来帮助大模型更好地从示例学习中掌握解决问题的方法。

那么,如何降低大模型的学习难度?即如何让大模型无需通过示例这一媒介,就能直接获取解决下游任务的方法?

一般来说,大模型的参数规模越大,情景学习能力也就越强。然而,当参数规模扩大的时候,算力要求也就越来越高,训练开销和推理开销也会急剧增长。

这些急剧增长的算力要求限制了大模型的应用场景,以至于很难将其在手机端进行部署。

随着大模型参数规模的逐渐增大,对于计算成本和存储成本的消耗也随之增加。尤其是 GPT-4 或千亿以上参数级的超级大模型,训练成本相当高昂。

因此,目前的研究方向之一便是:如何针对模型进行高效压缩,以便在加速推理的同时保持效果。若能将模型进行压缩,还能降低其推理成本,甚至让其与购买运行模型的端侧设备成本相当。

近期,已有不少研究致力于开发小规模、低算力需求的模型,并取得了一定成果。

2023 年 6 月,微软发布 13 亿参数的语言模型 Phi,同年 9 月 Phi-2 的参数扩大到 27 亿。据报道,微软的“小模型”已经在金融客户和银行客户中测试。此后,国内厂商也逐步跟进小模型的研究与应用。

这一系列小规模参数模型的发布,也表明大模型研发逐渐从“做大”转移到“做小”,且呈现出 N 个⼤模型 K 个小模型,同时 N << K 的现象。

所以,如何让小模型保持高效率的同时,提高其下游任务的性能,成为一个重要的方向。

基于此,人们也在探索如何让小参数模型的能力,能够媲美大参数模型。

另一方面,在目前的情景学习方法之中,通常需要针对每个测试问题进行一次示例筛选,无法针对某一个下游问题形成通用的“演示内容”,从而达到一劳永逸的效果。

以人类学习为例,在获得一些示例之后:其一,我们不仅可以直接通过找出规律,推测出来给定问题的标签。其二,还可以针对示例进行研究,从而形成一套更加抽象、更加通用的解题法则。

而第二种方法更加具备普适性和稳定性,也是广受认可的一种学习方法。以处理情感分类任务为例,人类能够总结一些通用的解题法则。

比如当我们在学习一些表达情绪的关键词时,就要关注否定词对于原始情感的反转。

而在本次研究之中,李志宇等人通过实验发现:基于能力较强的大模型,可以总结出来一些技能经验,他们将其称之为魔法书(Grimoire)。

而当把这些技能经验传递给能力较弱的大模型,则能显著提高能力较弱的大模型在下游任务上的表现。甚至对于部分小模型而言,通过学习 Grimoire,它们在一些任务上的性能表现甚至超过 GPT-4。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 模型原理示意图(来源:arXiv)

整体来说:

对于大模型的情景学习来说,该团队提供了一个全新的视角,帮助大模型针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。

对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 学习魔法书的小孩(来源:DALL-E 生成)

如果说之前的 AI 研究是以月为单位来计算,那么在大模型时代则是以周为单位来计算。各类 AI 技术“日新周异”,在这种高速创新的环境压强之下,也给大模型时代的从业者提出了更大的挑战。

研究伊始,李志宇和同事希望借助于模型的自我纠正来提升小模型的表现。但是,随着实验的进展他们发现受限于小模型自身的推理能力和理解能力,导致很难获得有效的提升。

正当一筹莫展之时,他们无意间看到了一则朋友圈。发这则朋友圈的人是一名家长,其分享了关于“学霸笔记”的内容。

这让他们瞬间顿悟:既然小模型的推理和总结能力比较弱,那么为什么不能让强模型(学霸)去总结经验(魔法书),然后将经验传授给小模型(学弱)?

上述想法一经提出,立马获得组内其他成员的一致赞同,于是李志宇等人迅速开展模型设计和模型实验。

“当发现最终效果超过预期之后,我们不得不感叹:科研源自生活!”李志宇表示。

日前,相关论文以《增强大型语言模型所需的全部内容就是魔法书》(Grimoire is All You Need for Enhancing Large Language Models)为题发在 arXiv[1]。

陈鼎是第一作者,李志宇担任通讯作者。

科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力

图 | 相关论文(来源:arXiv)

此外,在本次论文发布一个月左右,来自美国加州大学伯克利分校、美国卡内基梅隆大学和 DeepMind 公司组成的研究团队,发表了一篇类似的论文[2]。

李志宇表示:“同行的这篇论文和我们的思路如出一辙,他们提出的方法正是我们所提出方法中第一个阶段样本筛选中的其中一种,即困难样本筛选。同行提出的方法,更像是我们所提出的方案的一个子集,这为我们的后续研究增强了信心。”

目前,李志宇和同事提出的新型情景学习方法,旨在通过“强模型”基于代表性示例样本生成 Grimoire,从而提升“弱模型”在下游任务上的表现。

未来,他们打算训练一个专门生成 Grimoire 的大模型,从而保证 Grimoire 生成的稳定性和可控性。

同时,也将基于小模型的任务描述和现有示例等信息,生成代表性的示例样本。这样一来,就不需要遍历训练集进行筛选,而是可以通过专门的小模型,来生成特定的代表性样本。

不仅能让样本更具有针对性,也能保证代表性样本的稳定性,同时还能避免对于训练集样本的依赖。

届时,通过输入测试样例的少量信息,即可生成几个示例样本,以此作为提示下游模型完成任务的上下文学习示例,从而大幅增强下游模型的性能表现。

假如这些后续研究能够顺利完成,将能更大程度地提升小模型的能力,从而为产业化落地提供更多支持。

参考资料:

1.https://arxiv.org/abs/2401.03385

2.http://export.arxiv.org/abs/2402.05403

运营/排版:何晨龙

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-03-01 12:45:35

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...么样的?早期,人们普遍认为,科学发展是循序渐进的,科学家不断涌现,将已有科学理论向前推进从而推动科学发现越来越接近真理。1962年,美国学者托马斯·库恩在《科学革命的结构》一
2023-01-19 11:33:00
Claude 3大模型引起学界关注,业内人士:或将开启科研新范式
破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来
2024-03-12 10:59:00
“上天”“入地”“下海” AI驱动中国科学创新加速前行
...。未来已来,我们正在见证科学范式变革,而这次,中国科学家站在了浪潮之巅。
2025-03-21 16:54:00
王坚院士最新发声:人类已进入计算范式时代,AI将成为科学革命的工具
...颁发给了在人工智能与基础科学交叉领域实现重大突破的科学家,不难窥见人工智能在科学研究中越来越重要的分量。王坚院士还特别提到了DeepSeek这种具有代表性的AI工具
2025-02-21 16:11:00
国内成立首个超级智能安全实验室
...动化研究所,由人民中科等单位共同建设,人民中科首席科学家担任实验室主任。多模态超级智能安全北京市重点实验室在中关村论坛上正式对外公开。中关村论坛供图北京市重点实验室作为北京市
2025-03-31 11:35:00
陆奇:未来大模型无处不在,是技术世界中的全新物种
...大模型都可以做到。而这个时代的典型职业将是创业者、科学家和艺术家。5月7日,陆奇在北京举行了一场超千人规模、主题为《新范式 新时代 新机会》的演讲,全程超三个小时。他就当前最
2023-05-15 13:00:00
科学研究范式已经变革!专家对科学引领智能变革这样说|世界顶尖科学家论坛
...面新闻记者 车家竹 上海报道11月7日,上海临港世界顶尖科学家论坛潮悦堂内,世界各国科学家一道讨论“科学引领智能变革—人工智能向善 共筑人类福祉”,顶尖科学家一同探索充满魅力
2023-11-08 17:05:00
第五范式迎面来,AI向善很关键
本文转自:解放日报多国科学家就人工智能驱动的科研变革提出真知灼见第五范式迎面来,AI向善很关键顾泳世界顶尖科学家碳大会现场。 本报记者 顾泳推动科学研究从“马拉松”到“加速跑”,
2023-11-08 06:44:00
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...可以快速、准确地将该药物会带来的影响一五一十地告诉科学家,那么必将极大降低科研人员的时间成本、以及相关厂商的资源成本,为更快、更精确地发现药物提供助力。前不久,中国科学技术大
2024-03-07 10:44:00
更多关于科技的资讯:
曹县汉服“遇上”拼多多:95后的创业翻盘记
鲁网10月24日讯曹县,素有“中国汉服产业重镇”之称,曾见证无数小微创业者在行业竞争中艰难求索。对许多创业者而言,汉服市场度过初期蓝海阶段后
2025-10-24 14:29:00
突破光谱检测瓶颈!中国计量大学本科生团队研制高分辨率光谱仪
通讯员:吴瑞鹏 何秋阳近日,第十九届“挑战杯”全国大学生课外学术科技作品竞赛正火热备赛中,全国高校参赛队伍蓄势待发。中国计量大学光学与电子科技学院本科生团队项目——“基于微反射镜阵列的高分辨率光谱仪”
2025-10-24 15:02:00
开普勒机器人登陆IROS 2025 以开放平台携手全球开发者共筑新生态
10月19日至25日,全球机器人领域两大顶级国际会议之一的2025年IEEE/RSJ智能机器人与系统国际会议(IROS 2025)在杭州隆重举行
2025-10-24 15:02:00
蓝月亮:用十二年为洁净艺术种下一棵“树”
10月23日,第十七届国际大学生暨青年艺术博览会(简称:大艺博)开幕。在武汉东部的中国光谷科技会展中心10000平方米的专业展馆内
2025-10-24 15:14:00
京东工业与南方电网供应链集团签署战略合作 以数智技术驱动供应链全面升级
10月20日,京东工业与南方电网供应链集团在广州正式签署战略合作协议,双方相关负责人出席签约仪式。此次合作标志着京东集团与南方电网在供应链领域的协作迈入全新阶段
2025-10-24 15:23:00
从OS到AI OS:荣耀MagicOS 10定义AI OS新时代
2025年10月23日,荣耀全球开发者大会暨AI终端生态大会在深圳坪山燕子湖国际会展中心隆重举行。本次大会系统阐释了MagicOS 10的品牌战略与发展路径
2025-10-24 15:32:00
最后窗口期!2025FHC上海环球食品展免费领票即将截止
2025FHC上海环球食品展已进入开幕倒计时!这场被誉为“全球食饮贸易超级接口”的盛会,已成为零售买家囤货、拓品的关键“战场”—20万㎡展出面积
2025-10-24 15:47:00
K90定价后引热议闪电降价,雷军:标准版12GB+512GB 版本首销月直降300元
2025年10月23日的红米K90发布会后,12GB+512GB版本原定价为3199元,但因用户反馈该版本与其他配置差价过大
2025-10-24 15:57:00
iPhone 17系列首批用户反应褪色? 苹果官方客服回应
近日,部分苹果 iPhone 17 Pro 及 iPhone 17 Pro Max 的首批用户在社交平台反映,其设备遭遇了机身褪色问题
2025-10-24 15:59:00
阿里夸克AI眼镜开启预售 体验者:轻若无物,稳如长在脸上“看一眼”就能支付
阿里巴巴首款自研AI眼镜——夸克AI眼镜24日0时在夸克智能设备天猫旗舰店开启预售。88VIP会员实际到手价为3699元
2025-10-24 16:35:00
河北新闻网讯(梁轩轩)“原以为开业办税很繁琐,没想到这么简单!”近日,石家庄市桥西区律吕五金产品商行法人柴浩在桥西区税务局办税大厅完成税务申报后
2025-10-24 16:59:00
近日,瑞众人寿河北分公司在保定举办了2025年嘉年华客服节系列活动之“养老规划线下体验日”活动,通过创新融合中医药文化
2025-10-24 17:06:00
“尖货”频出!临安这里科技含量UpUpUp
是一场什么样的比赛技术“尖货”频出“硬核”创新不断近日,2025“海康创行・瓴创青山”智能物联青山湖科技城高层次人才创业大赛第二期
2025-10-24 17:07:00
日前,邮储银行唐山市分行在其辖内网点全面推广集成化的“智能云柜”系统。该设备功能强大,整合了现金、非现金、凭证管理等逾400项个人业务
2025-10-24 17:08:00
行业领先全场景安装!海尔给“老铁门”装好了智能锁
近年来,智能门锁市场需求快速增长。数据显示,2025年上半年中国智能门锁全渠道销量达897万套,同比增长6.8%。市场火热的同时
2025-10-24 17:09:00