我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

类别：科技发布时间：2024-03-01 09:36:00 来源：DeepTech深科技

近日，上海算法创新研究院大模型团队的研究员李志宇和同事提出一种情景学习新范式：SLEICL（基于强模型增强的情景学习，Strong LLM Enhanced ICL），能更好地加速小模型的学术研究和产业落地。

借助这一方法可以大幅提升小模型的性能表现，从而让小模型在各种应用场景中更具竞争力。

图 | 李志宇（来源：李志宇）

在当前的大模型研究与产业化实践中，存在把模型“做大”和把模型“做小”这两个方向。

前者致力于达成超大的参数规模，往往达到千亿左右；后者致力于实现较少的参数规模，往往多为十亿左右。

“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。

情景学习（ICL，In-context Learning），是大语言模型能力的一个重要体现。

近期，有关大模型的情景学习机制和原理的相关研究，已经成为大模型的一个热门的方向。

前不久，在多个计算机人工智能顶会上，有关情景学习的研究内容均被热烈讨论。

情景学习的通常做法是：给到大模型一些示例和相应回答，然后大模型就能推断出下一个未知问题的答案。

比如将“我爱你”和“我恨你”这两个例子给到大模型。“我爱你”的标签是“积极”，“我恨你”的标签是“消极”。

那么，当你对大模型表示“我喜欢今天的阳光”，大模型大概率就能推断出“积极”的标签。

目前，针对情景学习的主要研究方向包括：示例筛选方法、示例顺序方法、示例结构方法、以及示例标签分布方法。

但是，这些方法的局限在于：仍在通过选择更好的示例、以及通过选择示例的呈现形式，来帮助大模型更好地从示例学习中掌握解决问题的方法。

那么，如何降低大模型的学习难度？即如何让大模型无需通过示例这一媒介，就能直接获取解决下游任务的方法？

一般来说，大模型的参数规模越大，情景学习能力也就越强。然而，当参数规模扩大的时候，算力要求也就越来越高，训练开销和推理开销也会急剧增长。

这些急剧增长的算力要求限制了大模型的应用场景，以至于很难将其在手机端进行部署。

随着大模型参数规模的逐渐增大，对于计算成本和存储成本的消耗也随之增加。尤其是 GPT-4 或千亿以上参数级的超级大模型，训练成本相当高昂。

因此，目前的研究方向之一便是：如何针对模型进行高效压缩，以便在加速推理的同时保持效果。若能将模型进行压缩，还能降低其推理成本，甚至让其与购买运行模型的端侧设备成本相当。

近期，已有不少研究致力于开发小规模、低算力需求的模型，并取得了一定成果。

2023 年 6 月，微软发布 13 亿参数的语言模型 Phi，同年 9 月 Phi-2 的参数扩大到 27 亿。据报道，微软的“小模型”已经在金融客户和银行客户中测试。此后，国内厂商也逐步跟进小模型的研究与应用。

这一系列小规模参数模型的发布，也表明大模型研发逐渐从“做大”转移到“做小”，且呈现出 N 个⼤模型 K 个小模型，同时 N << K 的现象。

所以，如何让小模型保持高效率的同时，提高其下游任务的性能，成为一个重要的方向。

基于此，人们也在探索如何让小参数模型的能力，能够媲美大参数模型。

另一方面，在目前的情景学习方法之中，通常需要针对每个测试问题进行一次示例筛选，无法针对某一个下游问题形成通用的“演示内容”，从而达到一劳永逸的效果。

以人类学习为例，在获得一些示例之后：其一，我们不仅可以直接通过找出规律，推测出来给定问题的标签。其二，还可以针对示例进行研究，从而形成一套更加抽象、更加通用的解题法则。

而第二种方法更加具备普适性和稳定性，也是广受认可的一种学习方法。以处理情感分类任务为例，人类能够总结一些通用的解题法则。

比如当我们在学习一些表达情绪的关键词时，就要关注否定词对于原始情感的反转。

而在本次研究之中，李志宇等人通过实验发现：基于能力较强的大模型，可以总结出来一些技能经验，他们将其称之为魔法书（Grimoire）。

而当把这些技能经验传递给能力较弱的大模型，则能显著提高能力较弱的大模型在下游任务上的表现。甚至对于部分小模型而言，通过学习 Grimoire，它们在一些任务上的性能表现甚至超过 GPT-4。

图 | 模型原理示意图（来源：arXiv）

整体来说：

对于大模型的情景学习来说，该团队提供了一个全新的视角，帮助大模型针对问题实现更好的泛化，无需再将情景学习拘泥于示例样本的构建和筛选。

对于大小模型的协作来说，针对端云协同的模型交互、以及利用小模型的能力，本次研究提供了新的参考方案。

图 | 学习魔法书的小孩（来源：DALL-E 生成）

如果说之前的 AI 研究是以月为单位来计算，那么在大模型时代则是以周为单位来计算。各类 AI 技术“日新周异”，在这种高速创新的环境压强之下，也给大模型时代的从业者提出了更大的挑战。

研究伊始，李志宇和同事希望借助于模型的自我纠正来提升小模型的表现。但是，随着实验的进展他们发现受限于小模型自身的推理能力和理解能力，导致很难获得有效的提升。

正当一筹莫展之时，他们无意间看到了一则朋友圈。发这则朋友圈的人是一名家长，其分享了关于“学霸笔记”的内容。

这让他们瞬间顿悟：既然小模型的推理和总结能力比较弱，那么为什么不能让强模型（学霸）去总结经验（魔法书），然后将经验传授给小模型（学弱）？

上述想法一经提出，立马获得组内其他成员的一致赞同，于是李志宇等人迅速开展模型设计和模型实验。

“当发现最终效果超过预期之后，我们不得不感叹：科研源自生活！”李志宇表示。

日前，相关论文以《增强大型语言模型所需的全部内容就是魔法书》（Grimoire is All You Need for Enhancing Large Language Models）为题发在 arXiv[1]。

陈鼎是第一作者，李志宇担任通讯作者。

图 | 相关论文（来源：arXiv）

此外，在本次论文发布一个月左右，来自美国加州大学伯克利分校、美国卡内基梅隆大学和 DeepMind 公司组成的研究团队，发表了一篇类似的论文[2]。

李志宇表示：“同行的这篇论文和我们的思路如出一辙，他们提出的方法正是我们所提出方法中第一个阶段样本筛选中的其中一种，即困难样本筛选。同行提出的方法，更像是我们所提出的方案的一个子集，这为我们的后续研究增强了信心。”

目前，李志宇和同事提出的新型情景学习方法，旨在通过“强模型”基于代表性示例样本生成 Grimoire，从而提升“弱模型”在下游任务上的表现。

未来，他们打算训练一个专门生成 Grimoire 的大模型，从而保证 Grimoire 生成的稳定性和可控性。

同时，也将基于小模型的任务描述和现有示例等信息，生成代表性的示例样本。这样一来，就不需要遍历训练集进行筛选，而是可以通过专门的小模型，来生成特定的代表性样本。

不仅能让样本更具有针对性，也能保证代表性样本的稳定性，同时还能避免对于训练集样本的依赖。

届时，通过输入测试样例的少量信息，即可生成几个示例样本，以此作为提示下游模型完成任务的上下文学习示例，从而大幅增强下游模型的性能表现。

假如这些后续研究能够顺利完成，将能更大程度地提升小模型的能力，从而为产业化落地提供更多支持。

参考资料：

1.https://arxiv.org/abs/2401.03385

2.http://export.arxiv.org/abs/2402.05403

运营/排版：何晨龙

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-03-01 12:45:35

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,范式,科学家,情景,能力,科学的资讯：

阿里研究院苏中:开放科学平台成为推动科技发展的关键变量

...么样的？早期，人们普遍认为，科学发展是循序渐进的，科学家不断涌现，将已有科学理论向前推进从而推动科学发现越来越接近真理。1962年，美国学者托马斯·库恩在《科学革命的结构》一

2023-01-19 11:33:00

Claude 3大模型引起学界关注，业内人士：或将开启科研新

破解量子算法、破译古老语言、用几个小时给出科学家花费数月才能得到的研究方案……自 AI 初创公司 Anthropic 于太平洋时间 2024 年 3 月 4 日发布 Claude 3 大模型以来

2024-03-12 10:59:00

“上天”“入地”“下海” AI驱动中国科学创新加速前行

...。未来已来，我们正在见证科学范式变革，而这次，中国科学家站在了浪潮之巅。

2025-03-21 16:54:00

王坚院士最新发声：人类已进入计算范式时代，AI将成为科学革命

...颁发给了在人工智能与基础科学交叉领域实现重大突破的科学家，不难窥见人工智能在科学研究中越来越重要的分量。王坚院士还特别提到了DeepSeek这种具有代表性的AI工具

2025-02-21 16:11:00

国内成立首个超级智能安全实验室

...动化研究所，由人民中科等单位共同建设，人民中科首席科学家担任实验室主任。多模态超级智能安全北京市重点实验室在中关村论坛上正式对外公开。中关村论坛供图北京市重点实验室作为北京市

2025-03-31 11:35:00

陆奇：未来大模型无处不在，是技术世界中的全新物种

...大模型都可以做到。而这个时代的典型职业将是创业者、科学家和艺术家。5月7日，陆奇在北京举行了一场超千人规模、主题为《新范式新时代新机会》的演讲，全程超三个小时。他就当前最

2023-05-15 13:00:00

科学研究范式已经变革！专家对科学引领智能变革这样说｜世界顶尖

...面新闻记者车家竹上海报道11月7日，上海临港世界顶尖科学家论坛潮悦堂内，世界各国科学家一道讨论“科学引领智能变革—人工智能向善共筑人类福祉”，顶尖科学家一同探索充满魅力

2023-11-08 17:05:00

第五范式迎面来，AI向善很关键

本文转自：解放日报多国科学家就人工智能驱动的科研变革提出真知灼见第五范式迎面来，AI向善很关键顾泳世界顶尖科学家碳大会现场。本报记者顾泳推动科学研究从“马拉松”到“加速跑”，

2023-11-08 06:44:00

科学家提出大模型分子交互学习框架，已在400多万分子对中验证

...可以快速、准确地将该药物会带来的影响一五一十地告诉科学家，那么必将极大降低科研人员的时间成本、以及相关厂商的资源成本，为更快、更精确地发现药物提供助力。前不久，中国科学技术大

2024-03-07 10:44:00

更多关于科技的资讯：

佛山正视利怎么样？品牌硬实力与全民口碑给出答案

在全民视力健康危机日益严峻的当下，我国视力问题人群已高达 7.8 亿，儿童青少年总体近视率近 60%，其中高中生近视率更是飙升至 87

2026-01-12 21:03:00

安建大教师最新研究成果破解心脏病变分割难题

大皖新闻讯近日，安徽建筑大学陈永麟老师联合南京林业大学、安徽大学及武汉市第三人民医院的专家们，创新性地提出了DAF-Mamba的高性能分割模型

2026-01-12 22:22:00

迪士尼限定快闪登陆马来西亚，杰森娱乐“生态出海”加速市场开拓

2026年1月9日，马来西亚吉隆坡核心商业地标LaLaport BBCC的ACG BASE正式上演为期一个多月的大型主题快闪——这是杰森娱乐集团携手迪士尼以及国际知名插画师Mik

2026-01-12 17:34:00

网络视听向何处发展？第五届网络视听创新发展论坛举办

中国青年报客户端讯（中青报·中青网记者余冰玥沈杰群）近日，“新大众文艺·新视听使命”第五届网络视听创新发展论坛在北京举办

2026-01-12 17:34:00

整治伪科普须下真功夫

打开手机，刷几条短视频，准能看见一条养生秘籍；翻几页朋友圈，也少不了长辈们转发的健康预警。从“吃木薯助眠”到“冷冻馒头会长黄曲霉毒素”

2026-01-12 18:18:00

报告显示：具身智能将进入落地阶段

中国消费者报北京讯（记者聂国春）1月8日，北京智源人工智能研究院发布年度报告《2026十大AI技术趋势》。报告指出，人工智能的演进核心正发生关键转移

2026-01-12 19:35:00

斩获两项国际大奖，连江古石村夜景火了!

近日，连江县古石村夜景照明设计作品“古石微光”接连斩获2025年美国LIT照明设计奖与2025美国IDA国际设计大奖两项国际大奖。

2026-01-12 19:40:00

私域直播治理难如何破局

中国消费者报报道（记者桑雪骐）2025年12月，市场监管总局公布5起民生领域私域直播虚假宣传典型案例。1月7日，市场监管总局发布《直播电商监督管理办法》《网络交易平台规则监督管理办法》

2026-01-12 19:05:00

三联家电41周年店庆：多重补贴叠加，引领春节消费热潮

鲁网1月12日讯新春佳节渐近，山东家电零售行业的领军品牌——三联家电迎来41周年庆典。1月16日至25日期间，一场盛大的店庆活动即将热烈展开

2026-01-12 17:01:00

沸石转轮厂家选型指南：从技术核心到实力企业全解析

随着全球环保法规日趋严苛，挥发性有机物（VOCs）治理成为工业企业合规运营的关键环节，沸石转轮吸附浓缩技术因高效节能的特性

2026-01-12 16:56:00

创意碰撞青春，立达 Z 世代・名流广告创意赛圆满落幕

当 Z 世代的脑洞与广告艺术激情碰撞，当校企协同的育人理念落地生根，一场聚焦创意与热爱的行业盛事圆满收官。12月29日

2026-01-12 16:58:00

王立岩：具身智能：未来产业新的增长点扫码阅读手机版

天津市优秀基层理论宣讲员风采展示党的二十届四中全会强调，要前瞻布局未来产业，推动包括具身智能在内的六个领域成为新的经济增长点

2026-01-12 14:15:00

刘伟涛博士出任时代天使首席医学官进一步强化全球医学体系建设

时代天使首席医学官刘伟涛博士近日，时代天使宣布，原赛德阳光口腔集团首席医疗官刘伟涛博士已正式加入时代天使，担任首席医学官兼高级副总裁

2026-01-12 16:08:00

东湖评论：以双创融合为翼，铸就荆楚科创高地

近日，2026年湖北省科技创新大会以“乘势而上、聚势提升”为基调，再次锚定打造具有全国影响力的科技创新高地的核心目标，明确将科技创新与产业创新深度融合作为发展新质生产力的关键路径

2026-01-12 16:41:00

创新内容与读者的连接方式，磨铁图书亮相2026北京图书订货会

在2026北京图书订货会上，磨铁携大量优质内容产品亮相。围绕“磨铁，总有新的____”这一slogan，磨铁通过沉浸式的展陈设计

2026-01-12 11:27:00

头条订阅服务

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力