我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

用模型进化模型，智源发布开源套装；大模型带不来AGI，LeCun提出三大挑战 | 最前线

类别：科技发布时间：2023-06-10 13:09:00 来源：36氪

文 | 周鑫雨

编辑 | 邓咏仪

大模型的下一站是通用人工智能（AGI）吗？

在6月9日开幕的智源大会上，来自中美两国AI领域的顶尖人才们围绕着大模型和AGI的未来进行了讨论。

由于非营利+科研型的特性，智源被业界视作“中国版的早期OpenAI”，同时也是国内AI人才的黄埔军校。在智源的大模型研究项目“悟道”中，汇聚了智谱华章唐杰、循环智能杨植麟、元乘象卢志武等AI创业的高校第一梯队。

这次大会上，参会阵容的豪华程度似乎也意味着，关于大模型的未来，到了需要建立全球性行业共识的时刻。与会者包括图灵奖得主Geoffrey Hinton、Yann LeCun、Joseph Sifakis和姚期智，Midjourney 创始人David Holz等。OpenAI创始人Sam Altman，将参加6月10日以“安全”为主题的分论坛。

“透明开放的生态”，是其中的一个主题。这一主题指向通过建立开放的开源生态和模型能力测评体系，探寻目前大模型能力的“天花板”。

自2021年推出了“世界上最大模型”、参数规模达到了1.75万亿的“悟道 2.0”后，智源在会上发布了“悟道 3.0”——一个围绕三个开源模型体系所打造的模型服务平台。“悟道 3.0”提供的模型服务包括底层数据处理和汇聚、模型能力和算法评测。

另一个主题，则围绕着人们如何从大模型时代，真正迈向AGI。

“它们（预训练模型）没有关于基础显示的知识。”在连线中，“深度学习三巨头”之一、Meta首席AI科学家Yann LeCun先给当下火热的大模型判了迈向AGI的“死刑”。而后，他给出了有关解决方案的构想：“像婴儿一样观察世界”。

基础模型+测评工具+迭代方案，开源“全家桶”发布

与2021年发布的以“纯炼大模型”为目标的1.0和2.0版本不同，用智源研究院院长黄铁军的话来说，“悟道 3.0”是“以大模型为核心的生态”，其中包括底层数据处理和汇聚、模型能力和算法评测、开源开放，形成一套高效的大模型技术和算法体系。

通俗来讲，“悟道 3.0”就是用大模型来更科学和可控地“炼模型”。

这一模型训练模型的体系包括两个开源大模型基座：语言大模型系列“悟道·天鹰”，视觉大模型系列“悟道·视界”，一个开源大模型评测体系与开放平台FlagEval（天秤），一个大模型技术开源体系FlagOpen（飞智）。

1、“悟道·天鹰”和“悟道·视界”

语言大模型系列“悟道·天鹰”包含了基础模型Aquila（7B和33B版本）、对话模型AquilaChat和文本-代码生成模型AquilaCode。

对标ChatGPT，AquilaChat在提供对话功能的同时，还能通过定义可扩展的指令规范，调用其他模型的API和第三方工具，弥补单模态对话模型的局限性。

用模型进化模型，智源发布开源套装；大模型带不来AGI，LeCun提出三大挑战 | 最前线

AquilaChat的文字对话能力。图源：智源

比如仅靠AquilaChat无法实现文生图的功能，但是靠调用智源开源的文生图模型AltDiffusion，就能弥补文字模型”偏科”的短板。若是进一步调用图像编辑器InstructFace，用户还能实现对图像的编辑。

AquilaChat调用AltDiffusion生成图片。图源：智源

AquilaChat调用图像编辑器InstructFace可以对人像进行调整。图源：智源

此次推出的文生代码模型AquilaCode-7B，目前能够在使用更少训练数据和参数的情况下，性能接近OpenAI的CodeX-12B，并且在芯片架构适配性上具有较好的包容性。

AquilaCode实现时钟程序的代码编写。图源：智源

“悟道·视界”则提供了5个基础模型：多模态大模型Emu、十亿级视觉基础模型EVA、开源 CLIP模型EVA-CLIP、通用视觉模型Painter、视界通用分割模型SegGPT。

与此同时，“悟道·视界”还基于基础模型，推出了零样本视频编辑方法vid2vid -zero。所谓的“无样本”，指的是用注意力机制动态运算结合图像扩散模型，代替原有的用大量视频数据进行模型训练的方案。

举个例子，当画面中出现了一个跑步的人，算法能够自动区别运动的人和身后的景色，只要输入prompt，就能够对人和风景分别进行编辑。

vid2vid -zero对视频画面元素的分割。图源：vid2vid -zero论文

2、FlagEval（天秤）

除了不断提升模型对多模态内容的推理演绎能力，提高模型的“可解释性”同样重要——这能帮助我们像理解大脑一样，去理解大模型的“智能”从何而来，从而为提升模型的性能和安全性提供根本的解决方案。

目前，FlagEval构建了“能力-任务-指标”的三维评测框架，形成了包括30+种能力、5种任务、4大类指标在内的600+维的全面测评。

FlagEval构建的“能力-任务-指标”三维评测框架。图源：智源

结合“悟道·天鹰”，FlagEval目前已经实现了对语言和图文两类大模型的评测，并推出了大语言模型评测体系、多语言文图大模型评测工具mCLIP-Eval和文图生成评测工具ImageEval。

与此同时，FlagEval并非静态的模型打分工具，而是通过自动化评测和自适应评测机制“因材施教”，为模型提供针对性的训练意见。

3、FlagOpen（飞智）

通俗来讲，FlagOpen是一个开源数据、算法、模型、工具和评测体系的“仓库”。框架FlagBoot、AIGC应用FlagStudio等体系组成部分则构成了承担不同功能的“储物间”。

比如其中的大模型算法开源项目FlagAI，集成了全球主流的大模型算法和技术方案，包括语言大模型OPT和T5、视觉大模型ViT和Swin Transformer，以及多模态大模型CLIP。

FlagOpen构建了涵盖数据、算法、模型、工具和评测体系的开源仓库。图源：智源

大模型、类脑智能、具身智能，三条大路互通AGI

语言大模型的智能涌现固然令人兴奋，但智源大会上学者达成的共识是：强如GPT的预训练模型，难以通往真正的AGI。

其原因在于自监督的训练方法。自监督的出现，代替了原有需要大量标注数据的监督学习，提高了深度学习的效率。但自监督的问题也很明显：机器只能根据输入的数据对空缺部分进行了预测，但并不理解前后之间的现实关系。

Yann LeCun指出，“如果你将这些模型训练在一万亿个 Token 或两万亿个 Token 的数据上，它们的性能是惊人的。但最终，它们会犯很愚蠢的错误。它们会犯事实错误、逻辑错误、不一致性，它们的推理能力有限，会产生有害内容。”

这也导致了AI难以攻克的现状：大模型不具备基础现实的知识。

对此，黄铁军提出了通往AGI的三条路线：大模型、类脑智能、具身智能。它们之间并不孤立存在，而是相互作用和影响。

· 大模型：通过海量高质量数据，使得复杂的AI系统初步具有智能涌现能力；

· 类脑智能：形成基础的神经网络结构、信号加工机理等，使得机器达到类似于生物或人脑的能力；

· 具身智能：通过强化学习方法，利用物理实体与环境互动吸取经验和教训，不断调整自身策略。

Yann LeCun则用婴儿学习做了类比：当一个5个月大的婴儿看到小汽车漂浮在空中的照片，他并不会感到惊讶。但一个10个月大的婴儿会很吃惊，因为他知道物体在重力的作用下不可能漂浮在空中。

Yann Lecun。

“我认为，我们应该用机器复制这种通过观察世界或体验世界学习世界运作方式的能力。”在大会上，Yann LeCun重申了其于2022年提出的“世界模型（World Model）”理论。

他将视界是做由不同现实场景数据组成的系统，世界模型则能够精准预测出基于现实的行动。基于理想化的“世界模型”，机器将更加具有自主智能（Autonomous Intelligence）。

不过，在真正的AGI时代来临之前，他认为AI在未来几年首先需要面临3个主要挑战：

· 学习世界的表征和预测模型；

· 学习推理；

· 通过将复杂任务分解成简单任务，以分层的方式运行来规划复杂的行动序列。

欢迎交流

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-06-10 15:45:12

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,进化,套装,三大,模型,评测的资讯：

GEO 服务商权威选型指南：基于第三方评测数据匹配全场景需求

...布）在评估 GEO 服务商时，通过可量化指标构建综合能力模型，企业选型需优先参考以下核心维度，其中PureblueAI 清蓝在多维度中表现突出，成为评测中的标杆案例：技术实力

2025-10-24 10:43:00

RoboChallenge测评：π0、π0.5领先，自变量W

...速加速升温的当下，真实场景的客观评测成为检验机器人模型能力最关键的一环。近日，“具身进化论”在查询最新发布的RoboChallenge测试结果时注意到

2025-12-04 15:20:00

2025中国GEO服务市场格局解读：主流GEO服务商优势对比

...顶尖人才矩阵，率先构建 “全域可追溯AI搜索链路+异构模型协同迭代+环境自感知数据进化” 三大核心技术引擎。其服务客户在AI平台的品牌推荐率从平均18%提升至98

2025-10-27 14:20:00

科大讯飞刘庆峰：讯飞星火大模型10月底整体赶超ChatGPT

星星之火，可以燎原。5月6日，讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型，现场实测大模型七大核心能力，并发布教育、

2023-05-08 13:43:00

AI潮起共筑数智之基

...，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国

2024-05-25 07:21:00

扣子企业交流日最全回顾数万家企业都在怎么用扣子？

...能力无缝拓展至硬件。该方案凭借深度集成的豆包家族大模型与创新“端插件”，赋予硬件感知和操控物理世界的能力，并实现包括声纹识别，音频理解在内的智能语音感知技术，构建如智能外呼

2025-06-17 18:30:00

科大讯飞副总裁刘聪：认知智能大模型的技术阶跃及颠覆式影响｜W

...大讯飞副总裁、研究院院长刘聪发表了题为《认知智能大模型的技术阶跃及颠覆式影响》的主题演讲。刘聪认为，大模型“智能涌现”开启了机器自然语言交互式学习的“类人”新范式，将改变信息

2023-05-29 13:55:00

科大讯飞入局大模型混战，刘庆峰：10月底将赶超ChatGPT

出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下，科大讯飞成为最新的入局者。自去年12月15日，科大讯飞启动1+N的大模型专项攻关后，历时近半年终于发布了最新技术成果。5月6

2023-05-07 03:00:00

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大

2023-11-24 13:53:00

更多关于科技的资讯：

不熟悉新手机误开收费业务

82岁老人换了新手机，但不熟悉操作，结果误开通多项收费业务。3月11日，老人收到扣费短信后向网格员求助，顺利取消了扣费服务

2026-03-11 17:36:00

【财眼观两会】专访皇甫宜川：让海外通过文化“新三样”看见真实

中新经纬3月11日电 (董湘依)近年来，中国文化“新三样”(网文、网剧、网游)在海外迅速走红。全国两会期间，全国政协委员

2026-03-11 19:27:00

薛洪言：“养龙虾”火出圈，算力变成稀缺资源

中新经纬3月11日电题：“养龙虾”火出圈，算力变成稀缺资源作者薛洪言星图金融研究院常务副院长、苏商银行特约研究员2026年的早春

2026-03-11 19:28:00

开滦股份范各庄矿：为天车作业装上智慧“防护门”

河北新闻网讯（闫丽颖、唐福刚）近日，开滦股份范各庄矿聚焦“物理隔离+智能管控”核心需求，创新应用一套具备智能闭锁、声光报警

2026-03-11 19:51:00

中国联通eSIM尝鲜季再添新力

3月11日上午，中国联通eSIM尝鲜季——三星国内首款eSIM手机Galaxy S26系列首销仪式在西单北营业厅隆重举行

2026-03-11 14:14:00

3·15维权添利器！安徽“皖美维保”平台上线，家电维修不怕“

大皖新闻讯家里空调、冰箱等家电出故障，找维修却怕遇上“小病大修”“坐地起价”。别愁，专为安徽消费者打造的家电维修“放心平台”来了

2026-03-11 14:55:00

深耕AI应用构筑新质生产力，罗普特（688619.SH）获“

近日，备受瞩目的2025年度“吴文俊人工智能科学技术奖”获奖名单正式揭晓。罗普特（股票代码：688619.SH）作为主要完成单位参与的《面向海上安防的通感算一体化大数据智能处理关键技术及产业化》项目

2026-03-11 15:01:00

新华保险“空中柜面”让保单服务零距离

鲁网3月11日讯“您好，欢迎使用新华保险空中柜面服务！”当客户通过手机视频联系接通后台柜员时，这一句温暖的问候便会准时响起

2026-03-11 16:35:00

“养龙虾”，怎么就火了？

新华社记者曾晋“你‘养龙虾’了吗？”这句略显无厘头的有趣问话，说的可是最近科技圈的一件大事。此“龙虾”并非餐桌上的美味

2026-03-11 16:02:00

好评中国｜中国“铁牛”何以耕耘世界“丰”景？-中国吉林网

长白时评评论员丁铁巴基斯坦独立新闻社日前报道，曾是大型农场专属的现代农业机械化，正因中国农机驶入全球田间地头被改写，手工耕作的辛劳正被高效的机械作业替代

2026-03-11 11:32:00

降噪新科技，轻松听清晰，潜能发展更可期----科利耳Nucl

在移动互联高度发达的当下，听损人士的生活场景愈发多元：孩子们在游乐场嬉戏，笑声与广播声交织；学生们在校园里讨论，声音此起彼伏

2026-03-11 13:01:00

海湾深化转型，打造第二增长曲线

2025年，海湾安全技术有限公司（以下简称"海湾"）迈入发展新阶段，在消防行业深度变革的浪潮中交出了一份亮眼的答卷。新年伊始

2026-03-11 13:02:00

八马以科技为翼，武夷山超级工厂破解茶行业非标发展桎梏

中国茶行业千年发展,却长期受困于“非标”痛点,品质参差、产能有限成为行业升级的最大阻碍。而作为“高端中国茶第一股”的八马茶业

2026-03-11 13:04:00

厦门“汇智办”让缴费人“会自办”

实现社保一站式便民服务厦门“汇智办”让缴费人“会自办”东南网3月11日讯（海峡导报记者孙春燕通讯员杨楠欢叶璐璐廖皓宇）受春节过后的“返工潮”影响

2026-03-11 13:46:00

探路制造出海“关键一跃”：华南师范大学调研团队走进华翱集团

面对复杂多变的国际环境，佛山制造业正迎来新一轮深度转型的关键期。从深耕国内市场到逐鹿全球蓝海，如何实现从单一“产品出海”向涵盖“技术-制造-品牌”的全链条出海跨越

2026-03-11 13:04:00

头条订阅服务

用模型进化模型，智源发布开源套装；大模型带不来AGI，LeCun提出三大挑战 | 最前线