• 我的订阅
  • 科技

谷歌大模型推理范式,主要分为两个阶段

类别:科技 发布时间:2024-02-10 21:09:00 来源:浅语科技

谷歌&南加大推出最新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。

谷歌大模型推理范式,主要分为两个阶段

核心策略其实很简单:千人千面。让大模型针对不同问题,提出特定的推理结构。完全不同于以往CoT等方法“千篇一律”的方式。

谷歌大模型推理范式,主要分为两个阶段

这种灵活应变的方式,更加贴近于人类的思考模式,也向着期待中的大模型思维方式更进一步。

谷歌大模型推理范式,主要分为两个阶段

大模型“千人千面”一直以来大模型在处理复杂问题时都容易遇到困难,所以一些模拟人类思维能力的提示方法被提出。最出名的就是思维链(CoT),它通过引导大模型“一步一步来”,让大模型能像人类一样逐步思考解决问题,最终带来显著性能提升。还有分解法(decomposition-basedprompting),它是让大模型将复杂问题拆解成一个个更小的子问题。这类方法本身都能充当一个原子推理模块,对给定任务的处理过程做了先验假设,也就是让不同问题都套到同一个流程里解决。但是不同方法其实都有更擅长和不擅长的领域。比如在解决涉及符号操作等问题时,分解法要优于CoT。所以研究人员提出,对于每个任务,都应该有独特的内在推理过程,同时还不提高模型的推理成本。

谷歌大模型推理范式,主要分为两个阶段

自发现步骤架构由此而来。它主要分为两个阶段。第一阶段指导大语言模型从原子推理模块中进行挑选、调整、整合,搭建出一个可以解决特定任务的推理结构。比如“创造思维”可能在创作故事任务上有帮助、“反思思考”可能对搜索科学问题有帮助等。大模型需要根据任务进行挑选,然后进一步调整并完成整合。

谷歌大模型推理范式,主要分为两个阶段

第二阶段输入实例,让大模型使用第一阶段发现的推理结构来生成答案。

谷歌大模型推理范式,主要分为两个阶段

通过在GPT-4和PaLM2上进行实验,在BBH、T4D、MATH几个基准中,使用自发现步骤架构后,模型的性能都有明显提升。

谷歌大模型推理范式,主要分为两个阶段

在更细分的测试中,自发现步骤在需要世界知识的任务中表现最好,在算法、自然语言理解上超过CoT。

谷歌大模型推理范式,主要分为两个阶段

在处理问题的推理调用方面,自发现步骤需要的调用次数明显少于CoT+SelfConsistency,而且准确性更高。如果想要达到和自发现步骤同样的准确率,需要的推理计算量则是其40倍。

谷歌大模型推理范式,主要分为两个阶段

研究团队本项研究由南加州大学和谷歌DeepMind联合推出。第一作者是PeiZhou,他现在正在南加州大学的NLP小组攻读博士。两位通讯作者分别是HuaixiuZheng和SwaroopMishra。HuaixiuZheng此前参与过谷歌LaMDA工作,这是谷歌一个专攻对话的大模型。SwaroopMishra是谷歌DeepMind的研究科学家,它参与的Self-Instruct框架在GitHub上星标3.5k、被引用次数超过600,并被ACL2023接收。此外QuocLe、DennyZhou等大模型提示微调、推理方向的老面孔也参与其中。虽然官方暂未开源,但已经有迫不及待的开发者根据论文自行复现了代码。发现不仅适用于GPT-4和谷歌PaLM,连Mistral家泄露版模型Miqu上都能很好发挥作用。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-10 23:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

港中文团队提出大模型元推理范式,革新大模型的评价体系
...段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个
2024-03-04 10:23:00
本文转自:人民日报海外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(Op
2025-02-27 05:08:00
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...院大模型团队的研究员李志宇和同事提出一种情景学习新范式:SLEICL(基于强模型增强的情景学习,Strong LLM Enhanced ICL)
2024-03-01 09:36:00
对标o1,Kimi放出了最能打的国产模型
AI 领域正在经历新一轮技术范式的变化,预训练 Scaling Law 放缓之后,推理时间计算成为了新的性能提升关键。两个月前
2024-11-19 09:50:00
大模型面临四大关键缺陷,“知识方程”能否通向强人工智能
...有很大不同。 当前AI正在经历从感知智能向认知智能的范式转变。众所周知,人类拥有两套推理系统,即直觉思考的快系统和理性思考的慢系统。快系统是一种底层、快速、下意识、不加思索
2023-08-23 11:03:00
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算)
2024-10-21 09:55:00
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散编码,本文采用了 SNAC 编解码方案
2024-09-07 09:44:00
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...知识关联,对大语言模型也更友好,同时,参考 DIKW 层次范式在同一实体空间中支持 Schema 约束、无模式建模及文本结构的分层表示
2024-09-13 13:33:00
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...幅提升了其后训练方法的复杂度,具体包括采用多轮训练范式、使用人类数据 + 合成数据、使用多个训练算法和训练目标。也正因为此,这些模型的通用性能和专业能力都非常强。但遗憾的是,
2024-11-26 09:44:00
更多关于科技的资讯:
重磅首发!有道AI答疑笔推出视频讲解,定义学习可视化新标准
近日,网易有道旗下AI原生学习硬件“有道AI答疑笔Space X”完成重要升级,正式推出国内首个高质量的AI“视频答疑”功能
2026-01-05 17:36:00
苏笑聪新书《情境的智慧》即将出版:探寻情境赋能之道
近日,情境教育理论研究及实践家、羽翼天成儿童情境教育创始人苏笑聪女士宣布,其“情境三部曲”的收官之作——《情境的智慧》即将正式出版
2026-01-05 17:36:00
"哪些中国企业创新做得不错?"——这个问题的答案,正在被一批勇于突破、持续创新的中国企业不断刷新。进入2025年,联想集团的创新势头不减
2026-01-05 17:37:00
2025年百城“盒区房”消费图景:轻悦己、品质消费、夜经济氛围拉满
中国消费者报报道(记者桑雪骐)1月5日,《2025年百城“盒区房”消费力报告》(以下简称《报告》)发布,结合2025年盒马在多地门店及入驻商圈动态
2026-01-05 18:10:00
菌安天下:百吨位自然发酵技术全球领先品牌的科技解码
在全球农业面临资源约束与环境压力的双重挑战下,以微生物技术为核心的生物农业正成为引领产业变革的关键力量。在这场绿色革命中
2026-01-05 19:23:00
中荷人寿荣获“杰出寿险公司”奖
近日,由金融界主办的“启航•2025金融年会”暨金智奖颁奖盛典在北京举行。中荷人寿保险有限公司凭借其卓越的经营管理能力
2026-01-05 19:24:00
菌安天下:铸就液体微生物菌剂全国销量第一的品质标杆品牌
在当前中国农业向绿色、可持续发展转型的宏大背景下,农资市场的竞争日益激烈,而真正的“好产品”——那些能让种植户主动复购
2026-01-05 19:27:00
中国消费者报北京讯(记者桑雪骐)空调业的“铜铝之争”由来已久,近段时间再次成为热点话题。1月4日,中国家用电器协会发出倡议
2026-01-05 18:10:00
书亦烧仙草连获双奖:交付给新茶饮行业的长期主义答卷
近日,新茶饮品牌书亦烧仙草接连将“2025食品饮料行业创新案例”与“质量金盾·服务样本”两项行业奖收入囊中。两项奖项分别指向“市场创新”与“品质体系”这两个关键维度
2026-01-05 17:06:00
惠依近日,“Slop”被《韦氏词典》列入2025年度热词,被定义为“通常由人工智能(AI)批量生成的低质量数字内容”。据专家溯源
2026-01-05 14:05:00
全面解读一嗨租车八大优势 站内取还创服务体验新高度
在租车行业,真正的竞争力,藏在看不见的后台体系里:是否统一管理?标准能否落地?出了问题谁来负责?这些问题的答案,决定了一家租车企业的服务成色
2026-01-05 14:05:00
新青年消费崛起,大窑饮品满足“理性+感性”双重决策
花钱主打“爱你老己”、倡导“隐形享受主义”……在当今消费市场中,新青年群体已成为不可忽视的力量。《2025新青年消费趋势报告》揭示
2026-01-05 14:05:00
数智赋能文旅 1314・爱购节情感IP启幕文旅融合新范式
1月4日,“2026 数字经济助力文旅融合新业态创新交流会”在京成功举办,以“提升新质消费 创新业态场景”为主题,共探“数智+文旅+情感消费”融合之道
2026-01-05 14:35:00
温医大眼视光胡亮/吕帆教授团队成功研发智能手机眨眼训练应用程序,开辟干眼症治疗新路径
近日,眼和视光疾病国家临床医学研究中心、国家眼视光工程技术研究中心、温州医科大学附属眼视光医院胡亮/吕帆教授团队的一项重要研究成果在国际高质量期刊《自然》杂志旗下《数字医学》(npj Digital Medicine)在线发表
2026-01-05 15:46:00
用“中国芯”吹出“爱你的风”
江南时报讯 “这是我们的意大利客户发来的使用反馈,一直在说我们的产品特别惊艳。”在不久前结束的第138届中国进出口商品交易会上
2026-01-05 16:07:00