• 我的订阅
  • 科技

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

类别:科技 发布时间:2023-06-10 13:09:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

大模型的下一站是通用人工智能(AGI)吗?

在6月9日开幕的智源大会上,来自中美两国AI领域的顶尖人才们围绕着大模型和AGI的未来进行了讨论。

由于非营利+科研型的特性,智源被业界视作“中国版的早期OpenAI”,同时也是国内AI人才的黄埔军校。在智源的大模型研究项目“悟道”中,汇聚了智谱华章唐杰、循环智能杨植麟、元乘象卢志武等AI创业的高校第一梯队。

这次大会上,参会阵容的豪华程度似乎也意味着,关于大模型的未来,到了需要建立全球性行业共识的时刻。与会者包括图灵奖得主Geoffrey Hinton、Yann LeCun、Joseph Sifakis和姚期智,Midjourney 创始人David Holz等。OpenAI创始人Sam Altman,将参加6月10日以“安全”为主题的分论坛。

“透明开放的生态”,是其中的一个主题。这一主题指向通过建立开放的开源生态和模型能力测评体系,探寻目前大模型能力的“天花板”。

自2021年推出了“世界上最大模型”、参数规模达到了1.75万亿的“悟道 2.0”后,智源在会上发布了“悟道 3.0”——一个围绕三个开源模型体系所打造的模型服务平台。“悟道 3.0”提供的模型服务包括底层数据处理和汇聚、模型能力和算法评测。

另一个主题,则围绕着人们如何从大模型时代,真正迈向AGI。

“它们(预训练模型)没有关于基础显示的知识。”在连线中,“深度学习三巨头”之一、Meta首席AI科学家Yann LeCun先给当下火热的大模型判了迈向AGI的“死刑”。而后,他给出了有关解决方案的构想:“像婴儿一样观察世界”。

基础模型+测评工具+迭代方案,开源“全家桶”发布

与2021年发布的以“纯炼大模型”为目标的1.0和2.0版本不同,用智源研究院院长黄铁军的话来说,“悟道 3.0”是“以大模型为核心的生态”,其中包括底层数据处理和汇聚、模型能力和算法评测、开源开放,形成一套高效的大模型技术和算法体系。

通俗来讲,“悟道 3.0”就是用大模型来更科学和可控地“炼模型”。

这一模型训练模型的体系包括两个开源大模型基座:语言大模型系列“悟道·天鹰”,视觉大模型系列“悟道·视界”,一个开源大模型评测体系与开放平台FlagEval(天秤),一个大模型技术开源体系FlagOpen(飞智)。

1、“悟道·天鹰”和“悟道·视界”

语言大模型系列“悟道·天鹰”包含了基础模型Aquila(7B和33B版本)、对话模型AquilaChat和文本-代码生成模型AquilaCode。

对标ChatGPT,AquilaChat在提供对话功能的同时,还能通过定义可扩展的指令规范,调用其他模型的API和第三方工具,弥补单模态对话模型的局限性。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat的文字对话能力。图源:智源

比如仅靠AquilaChat无法实现文生图的功能,但是靠调用智源开源的文生图模型AltDiffusion,就能弥补文字模型”偏科”的短板。若是进一步调用图像编辑器InstructFace,用户还能实现对图像的编辑。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat调用AltDiffusion生成图片。图源:智源

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat调用图像编辑器InstructFace可以对人像进行调整。图源:智源

此次推出的文生代码模型AquilaCode-7B,目前能够在使用更少训练数据和参数的情况下,性能接近OpenAI的CodeX-12B,并且在芯片架构适配性上具有较好的包容性。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaCode实现时钟程序的代码编写。图源:智源

“悟道·视界”则提供了5个基础模型:多模态大模型Emu、十亿级视觉基础模型EVA、开源 CLIP模型EVA-CLIP、通用视觉模型Painter、视界通用分割模型SegGPT。

与此同时,“悟道·视界”还基于基础模型,推出了零样本视频编辑方法vid2vid -zero。所谓的“无样本”,指的是用注意力机制动态运算结合图像扩散模型,代替原有的用大量视频数据进行模型训练的方案。

举个例子,当画面中出现了一个跑步的人,算法能够自动区别运动的人和身后的景色,只要输入prompt,就能够对人和风景分别进行编辑。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

vid2vid -zero对视频画面元素的分割。图源:vid2vid -zero论文

2、FlagEval(天秤)

除了不断提升模型对多模态内容的推理演绎能力,提高模型的“可解释性”同样重要——这能帮助我们像理解大脑一样,去理解大模型的“智能”从何而来,从而为提升模型的性能和安全性提供根本的解决方案。

目前,FlagEval构建了“能力-任务-指标”的三维评测框架,形成了包括30+种能力、5种任务、4大类指标在内的600+维的全面测评。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

FlagEval构建的“能力-任务-指标”三维评测框架。图源:智源

结合“悟道·天鹰”,FlagEval目前已经实现了对语言和图文两类大模型的评测,并推出了大语言模型评测体系、多语言文图大模型评测工具mCLIP-Eval和文图生成评测工具ImageEval。

与此同时,FlagEval并非静态的模型打分工具,而是通过自动化评测和自适应评测机制“因材施教”,为模型提供针对性的训练意见。

3、FlagOpen(飞智)

通俗来讲,FlagOpen是一个开源数据、算法、模型、工具和评测体系的“仓库”。框架FlagBoot、AIGC应用FlagStudio等体系组成部分则构成了承担不同功能的“储物间”。

比如其中的大模型算法开源项目FlagAI,集成了全球主流的大模型算法和技术方案,包括语言大模型OPT和T5、视觉大模型ViT和Swin Transformer,以及多模态大模型CLIP。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

FlagOpen构建了涵盖数据、算法、模型、工具和评测体系的开源仓库。图源:智源

大模型、类脑智能、具身智能,三条大路互通AGI

语言大模型的智能涌现固然令人兴奋,但智源大会上学者达成的共识是:强如GPT的预训练模型,难以通往真正的AGI。

其原因在于自监督的训练方法。自监督的出现,代替了原有需要大量标注数据的监督学习,提高了深度学习的效率。但自监督的问题也很明显:机器只能根据输入的数据对空缺部分进行了预测,但并不理解前后之间的现实关系。

Yann LeCun指出,“如果你将这些模型训练在一万亿个 Token 或两万亿个 Token 的数据上,它们的性能是惊人的。但最终,它们会犯很愚蠢的错误。它们会犯事实错误、逻辑错误、不一致性,它们的推理能力有限,会产生有害内容。”

这也导致了AI难以攻克的现状:大模型不具备基础现实的知识。

对此,黄铁军提出了通往AGI的三条路线:大模型、类脑智能、具身智能。它们之间并不孤立存在,而是相互作用和影响。

· 大模型:通过海量高质量数据,使得复杂的AI系统初步具有智能涌现能力;

· 类脑智能:形成基础的神经网络结构、信号加工机理等,使得机器达到类似于生物或人脑的能力;

· 具身智能:通过强化学习方法,利用物理实体与环境互动吸取经验和教训,不断调整自身策略。

Yann LeCun则用婴儿学习做了类比:当一个5个月大的婴儿看到小汽车漂浮在空中的照片,他并不会感到惊讶。但一个10个月大的婴儿会很吃惊,因为他知道物体在重力的作用下不可能漂浮在空中。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

Yann Lecun。

“我认为,我们应该用机器复制这种通过观察世界或体验世界学习世界运作方式的能力。”在大会上,Yann LeCun重申了其于2022年提出的“世界模型(World Model)”理论。

他将视界是做由不同现实场景数据组成的系统,世界模型则能够精准预测出基于现实的行动。基于理想化的“世界模型”,机器将更加具有自主智能(Autonomous Intelligence)。

不过,在真正的AGI时代来临之前,他认为AI在未来几年首先需要面临3个主要挑战:

· 学习世界的表征和预测模型;

· 学习推理;

· 通过将复杂任务分解成简单任务,以分层的方式运行来规划复杂的行动序列。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-10 15:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...布)在评估 GEO 服务商时,通过可量化指标构建综合能力模型,企业选型需优先参考以下核心维度,其中PureblueAI 清蓝在多维度中表现突出,成为评测中的标杆案例:技术实力
2025-10-24 10:43:00
...速加速升温的当下,真实场景的客观评测成为检验机器人模型能力最关键的一环。近日,“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到
2025-12-04 15:20:00
...顶尖人才矩阵,率先构建 “全域可追溯AI搜索链路+异构模型协同迭代+环境自感知数据进化” 三大核心技术引擎。 其服务客户在AI平台的品牌推荐率从平均18%提升至98
2025-10-27 14:20:00
科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、
2023-05-08 13:43:00
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国
2024-05-25 07:21:00
扣子企业交流日最全回顾 数万家企业都在怎么用扣子?
...能力无缝拓展至硬件。该方案凭借深度集成的豆包家族大模型与创新“端插件”,赋予硬件感知和操控物理世界的能力,并实现包括声纹识别,音频理解在内的智能语音感知技术, 构建如智能外呼
2025-06-17 18:30:00
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...大讯飞副总裁、研究院院长刘聪发表了题为《认知智能大模型的技术阶跃及颠覆式影响》的主题演讲。刘聪认为,大模型“智能涌现”开启了机器自然语言交互式学习的“类人”新范式,将改变信息
2023-05-29 13:55:00
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6
2023-05-07 03:00:00
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大
2023-11-24 13:53:00
更多关于科技的资讯:
中国科大刷新固态量子存储效率纪录
大皖新闻讯 “器件体积同步缩小上千倍,实现了破纪录的存储效率。”中国科学技术大学相关人员在接受采访时表示。2月13日晚
2026-02-13 22:05:00
江西造出水稻、油菜生物育种“中国芯”
本报讯 (全媒体记者沈冠楠)“我国水稻、油菜育种终于有了自主、低价的固相芯片!”2月9日上午,在江西省农业科学院生物育种创新中心的实验室内
2026-02-13 22:38:00
深度数科携手日照银行落地首笔纯信用贸易融资——看中国大集如何以平台数据重塑“产业信用”新生态
鲁网2月13日讯2月11日,一笔无需抵押、无需担保的200万元贷款在临沂商城引发关注。外贸公司“临沂兴达”凭借在中国大集平台上的真实贸易数据
2026-02-13 17:17:00
健康年味成新风尚!线下药房特色年货服务筑牢消费保障
随着农历新年临近,年货采购迎来高峰。消费者的需求日益清晰:既要礼品体面有心意,也要价格透明有保障。在此背景下,蕴含健康理念的礼品逐渐成为主流
2026-02-13 18:30:00
中新经纬2月13日电 题:智慧文旅“开挂”,创新与隐私如何鱼和熊掌兼得?作者 周慎 中国科学技术大学科技传播系副研究员
2026-02-13 18:55:00
中国网2月13日讯 据国家外汇管理局网站消息,2025年四季度,我国经常账户顺差17137亿元,其中,货物贸易顺差21043亿元
2026-02-13 19:38:00
中国网2月13日讯 据市场监管总局网站消息,为支持和引导互联网平台经营者有效防范反垄断合规风险,促进平台经济创新和健康发展
2026-02-13 19:38:00
河北新闻网讯(王华英、赵春龙)近日,在秦皇岛市海港区新引进的AI循经调理中心,一台AI循经机器人正在为市民巡检身体。这款机器人通过“AI大脑”人工智能算法
2026-02-13 17:46:00
瞿周2026年初,一部拍摄于多年前的小众纪录片《重返狼群》意外刷屏全网:抖音影视创作者@笔战风华的一条解说视频,收获超千万点赞
2026-02-13 14:10:00
喜旺春节礼盒燃爆卖场,热销势不可挡
马年新春将至,家家户户忙着囤年货、备年礼。各大商超卖场内,喜旺春节礼盒专区人头攒动、热闹非凡,选购人群络绎不绝,导购员忙碌不停
2026-02-13 14:57:00
百味中药“走”流水线,15秒配齐一副方 临沂智慧共煎药房藏着“神算子”
鲁网2月13日讯这里没有等位的长龙,没有穿梭的药柜;这里只有机器的低鸣、传送带的律动,以及每15秒,一方精准配伍的良药从流水线“智”造而出
2026-02-13 15:33:00
一张电子发票在医院扫码结算后,保险金几乎同步到账——这是上海L先生真实的理赔过程,这超乎想象的便捷,正成为数千万客户理赔体验的真实切片
2026-02-13 16:07:00
2月13日,京东集团面向全球90万京东人发布新春贺信,今年的新春贺信以《始终在成长,永远有梦想》为主题,全文如下:各位京东同事
2026-02-13 16:36:00
鲁网2月13日讯随着春节气息愈发浓厚,一场覆盖消费、民生多场景的促消费行动正在青岛温暖铺开。面对新消费趋势与实体经济的实际需求
2026-02-13 11:26:00
大麦娱乐与快达票达成战略投资合作 将共同开发港澳台市场
2月13日,大麦娱乐与香港知名票务平台快达票达成战略投资合作,双方宣布将透过各自在大中华地区门票销售的丰富经验,打造跨平台的升级购票体验
2026-02-13 11:32:00