• 我的订阅
  • 科技

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

类别:科技 发布时间:2023-06-10 13:09:00 来源:36氪

文 | 周鑫雨

编辑 | 邓咏仪

大模型的下一站是通用人工智能(AGI)吗?

在6月9日开幕的智源大会上,来自中美两国AI领域的顶尖人才们围绕着大模型和AGI的未来进行了讨论。

由于非营利+科研型的特性,智源被业界视作“中国版的早期OpenAI”,同时也是国内AI人才的黄埔军校。在智源的大模型研究项目“悟道”中,汇聚了智谱华章唐杰、循环智能杨植麟、元乘象卢志武等AI创业的高校第一梯队。

这次大会上,参会阵容的豪华程度似乎也意味着,关于大模型的未来,到了需要建立全球性行业共识的时刻。与会者包括图灵奖得主Geoffrey Hinton、Yann LeCun、Joseph Sifakis和姚期智,Midjourney 创始人David Holz等。OpenAI创始人Sam Altman,将参加6月10日以“安全”为主题的分论坛。

“透明开放的生态”,是其中的一个主题。这一主题指向通过建立开放的开源生态和模型能力测评体系,探寻目前大模型能力的“天花板”。

自2021年推出了“世界上最大模型”、参数规模达到了1.75万亿的“悟道 2.0”后,智源在会上发布了“悟道 3.0”——一个围绕三个开源模型体系所打造的模型服务平台。“悟道 3.0”提供的模型服务包括底层数据处理和汇聚、模型能力和算法评测。

另一个主题,则围绕着人们如何从大模型时代,真正迈向AGI。

“它们(预训练模型)没有关于基础显示的知识。”在连线中,“深度学习三巨头”之一、Meta首席AI科学家Yann LeCun先给当下火热的大模型判了迈向AGI的“死刑”。而后,他给出了有关解决方案的构想:“像婴儿一样观察世界”。

基础模型+测评工具+迭代方案,开源“全家桶”发布

与2021年发布的以“纯炼大模型”为目标的1.0和2.0版本不同,用智源研究院院长黄铁军的话来说,“悟道 3.0”是“以大模型为核心的生态”,其中包括底层数据处理和汇聚、模型能力和算法评测、开源开放,形成一套高效的大模型技术和算法体系。

通俗来讲,“悟道 3.0”就是用大模型来更科学和可控地“炼模型”。

这一模型训练模型的体系包括两个开源大模型基座:语言大模型系列“悟道·天鹰”,视觉大模型系列“悟道·视界”,一个开源大模型评测体系与开放平台FlagEval(天秤),一个大模型技术开源体系FlagOpen(飞智)。

1、“悟道·天鹰”和“悟道·视界”

语言大模型系列“悟道·天鹰”包含了基础模型Aquila(7B和33B版本)、对话模型AquilaChat和文本-代码生成模型AquilaCode。

对标ChatGPT,AquilaChat在提供对话功能的同时,还能通过定义可扩展的指令规范,调用其他模型的API和第三方工具,弥补单模态对话模型的局限性。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat的文字对话能力。图源:智源

比如仅靠AquilaChat无法实现文生图的功能,但是靠调用智源开源的文生图模型AltDiffusion,就能弥补文字模型”偏科”的短板。若是进一步调用图像编辑器InstructFace,用户还能实现对图像的编辑。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat调用AltDiffusion生成图片。图源:智源

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaChat调用图像编辑器InstructFace可以对人像进行调整。图源:智源

此次推出的文生代码模型AquilaCode-7B,目前能够在使用更少训练数据和参数的情况下,性能接近OpenAI的CodeX-12B,并且在芯片架构适配性上具有较好的包容性。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

AquilaCode实现时钟程序的代码编写。图源:智源

“悟道·视界”则提供了5个基础模型:多模态大模型Emu、十亿级视觉基础模型EVA、开源 CLIP模型EVA-CLIP、通用视觉模型Painter、视界通用分割模型SegGPT。

与此同时,“悟道·视界”还基于基础模型,推出了零样本视频编辑方法vid2vid -zero。所谓的“无样本”,指的是用注意力机制动态运算结合图像扩散模型,代替原有的用大量视频数据进行模型训练的方案。

举个例子,当画面中出现了一个跑步的人,算法能够自动区别运动的人和身后的景色,只要输入prompt,就能够对人和风景分别进行编辑。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

vid2vid -zero对视频画面元素的分割。图源:vid2vid -zero论文

2、FlagEval(天秤)

除了不断提升模型对多模态内容的推理演绎能力,提高模型的“可解释性”同样重要——这能帮助我们像理解大脑一样,去理解大模型的“智能”从何而来,从而为提升模型的性能和安全性提供根本的解决方案。

目前,FlagEval构建了“能力-任务-指标”的三维评测框架,形成了包括30+种能力、5种任务、4大类指标在内的600+维的全面测评。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

FlagEval构建的“能力-任务-指标”三维评测框架。图源:智源

结合“悟道·天鹰”,FlagEval目前已经实现了对语言和图文两类大模型的评测,并推出了大语言模型评测体系、多语言文图大模型评测工具mCLIP-Eval和文图生成评测工具ImageEval。

与此同时,FlagEval并非静态的模型打分工具,而是通过自动化评测和自适应评测机制“因材施教”,为模型提供针对性的训练意见。

3、FlagOpen(飞智)

通俗来讲,FlagOpen是一个开源数据、算法、模型、工具和评测体系的“仓库”。框架FlagBoot、AIGC应用FlagStudio等体系组成部分则构成了承担不同功能的“储物间”。

比如其中的大模型算法开源项目FlagAI,集成了全球主流的大模型算法和技术方案,包括语言大模型OPT和T5、视觉大模型ViT和Swin Transformer,以及多模态大模型CLIP。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

FlagOpen构建了涵盖数据、算法、模型、工具和评测体系的开源仓库。图源:智源

大模型、类脑智能、具身智能,三条大路互通AGI

语言大模型的智能涌现固然令人兴奋,但智源大会上学者达成的共识是:强如GPT的预训练模型,难以通往真正的AGI。

其原因在于自监督的训练方法。自监督的出现,代替了原有需要大量标注数据的监督学习,提高了深度学习的效率。但自监督的问题也很明显:机器只能根据输入的数据对空缺部分进行了预测,但并不理解前后之间的现实关系。

Yann LeCun指出,“如果你将这些模型训练在一万亿个 Token 或两万亿个 Token 的数据上,它们的性能是惊人的。但最终,它们会犯很愚蠢的错误。它们会犯事实错误、逻辑错误、不一致性,它们的推理能力有限,会产生有害内容。”

这也导致了AI难以攻克的现状:大模型不具备基础现实的知识。

对此,黄铁军提出了通往AGI的三条路线:大模型、类脑智能、具身智能。它们之间并不孤立存在,而是相互作用和影响。

· 大模型:通过海量高质量数据,使得复杂的AI系统初步具有智能涌现能力;

· 类脑智能:形成基础的神经网络结构、信号加工机理等,使得机器达到类似于生物或人脑的能力;

· 具身智能:通过强化学习方法,利用物理实体与环境互动吸取经验和教训,不断调整自身策略。

Yann LeCun则用婴儿学习做了类比:当一个5个月大的婴儿看到小汽车漂浮在空中的照片,他并不会感到惊讶。但一个10个月大的婴儿会很吃惊,因为他知道物体在重力的作用下不可能漂浮在空中。

用模型进化模型,智源发布开源套装;大模型带不来AGI,LeCun提出三大挑战 | 最前线

Yann Lecun。

“我认为,我们应该用机器复制这种通过观察世界或体验世界学习世界运作方式的能力。”在大会上,Yann LeCun重申了其于2022年提出的“世界模型(World Model)”理论。

他将视界是做由不同现实场景数据组成的系统,世界模型则能够精准预测出基于现实的行动。基于理想化的“世界模型”,机器将更加具有自主智能(Autonomous Intelligence)。

不过,在真正的AGI时代来临之前,他认为AI在未来几年首先需要面临3个主要挑战:

· 学习世界的表征和预测模型;

· 学习推理;

· 通过将复杂任务分解成简单任务,以分层的方式运行来规划复杂的行动序列。

欢迎交流

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-10 15:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

科大讯飞刘庆峰:讯飞星火大模型10月底整体赶超ChatGPT
星星之火,可以燎原。5月6日,讯飞星火认知大模型成果发布会在安徽合肥如期举行。科大讯飞董事长刘庆峰、研究院院长刘聪发布讯飞星火认知大模型,现场实测大模型七大核心能力,并发布教育、
2023-05-08 13:43:00
AI潮起 共筑数智之基
...,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国
2024-05-25 07:21:00
扣子企业交流日最全回顾 数万家企业都在怎么用扣子?
...能力无缝拓展至硬件。该方案凭借深度集成的豆包家族大模型与创新“端插件”,赋予硬件感知和操控物理世界的能力,并实现包括声纹识别,音频理解在内的智能语音感知技术, 构建如智能外呼
2025-06-17 18:30:00
科大讯飞副总裁刘聪:认知智能大模型的技术阶跃及颠覆式影响|WISE2023颠覆AIGC产业发展峰会
...大讯飞副总裁、研究院院长刘聪发表了题为《认知智能大模型的技术阶跃及颠覆式影响》的主题演讲。刘聪认为,大模型“智能涌现”开启了机器自然语言交互式学习的“类人”新范式,将改变信息
2023-05-29 13:55:00
科大讯飞入局大模型混战,刘庆峰:10月底将赶超ChatGPT
出品 | 搜狐科技作者 | 梁昌均国内大模型混战之下,科大讯飞成为最新的入局者。自去年12月15日,科大讯飞启动1+N的大模型专项攻关后,历时近半年终于发布了最新技术成果。5月6
2023-05-07 03:00:00
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
【CNMO新闻】“大模型时代,夸克有巨大机会创造出革新性搜索产品。”11月22日,夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示,夸克千亿级参数大
2023-11-24 13:53:00
AI安全守护计划启动!信通院牵头,AIIA安全治理委员会发布三类模型安全评测
...治理框架、合规治理、赋能治理展开,安全组主要开展大模型安全、合规等研究及基准测试。今年6月,中国信通院依托该委员会发起“人工智能安全守护计划”,包括建立威胁信息共享机制、开展
2024-07-25 09:26:00
字节扣子模型广场,给AI大模型搭了一座擂台
...AI现象级应用呼之欲出2022年11月,GPT-3.5让人们见到了AI大模型的强大威力,AIGC百花齐放,文生文、文生图
2024-06-14 11:40:00
飞渡科技发布“峥嵘大模型”:开启空间智能新时代,让世界学会思考
...,其实只是窥见了它的投影。如今,飞渡科技以“峥嵘大模型”重新定义空间智能——它不仅复刻现实,更赋予空间意义、结构与逻辑,让空间具备思考能力,赋能世界再造。峥嵘大模型:以技术感
2025-07-07 14:06:00
更多关于科技的资讯:
曹县汉服“遇上”拼多多:95后的创业翻盘记
鲁网10月24日讯曹县,素有“中国汉服产业重镇”之称,曾见证无数小微创业者在行业竞争中艰难求索。对许多创业者而言,汉服市场度过初期蓝海阶段后
2025-10-24 14:29:00
突破光谱检测瓶颈!中国计量大学本科生团队研制高分辨率光谱仪
通讯员:吴瑞鹏 何秋阳近日,第十九届“挑战杯”全国大学生课外学术科技作品竞赛正火热备赛中,全国高校参赛队伍蓄势待发。中国计量大学光学与电子科技学院本科生团队项目——“基于微反射镜阵列的高分辨率光谱仪”
2025-10-24 15:02:00
开普勒机器人登陆IROS 2025 以开放平台携手全球开发者共筑新生态
10月19日至25日,全球机器人领域两大顶级国际会议之一的2025年IEEE/RSJ智能机器人与系统国际会议(IROS 2025)在杭州隆重举行
2025-10-24 15:02:00
蓝月亮:用十二年为洁净艺术种下一棵“树”
10月23日,第十七届国际大学生暨青年艺术博览会(简称:大艺博)开幕。在武汉东部的中国光谷科技会展中心10000平方米的专业展馆内
2025-10-24 15:14:00
京东工业与南方电网供应链集团签署战略合作 以数智技术驱动供应链全面升级
10月20日,京东工业与南方电网供应链集团在广州正式签署战略合作协议,双方相关负责人出席签约仪式。此次合作标志着京东集团与南方电网在供应链领域的协作迈入全新阶段
2025-10-24 15:23:00
从OS到AI OS:荣耀MagicOS 10定义AI OS新时代
2025年10月23日,荣耀全球开发者大会暨AI终端生态大会在深圳坪山燕子湖国际会展中心隆重举行。本次大会系统阐释了MagicOS 10的品牌战略与发展路径
2025-10-24 15:32:00
最后窗口期!2025FHC上海环球食品展免费领票即将截止
2025FHC上海环球食品展已进入开幕倒计时!这场被誉为“全球食饮贸易超级接口”的盛会,已成为零售买家囤货、拓品的关键“战场”—20万㎡展出面积
2025-10-24 15:47:00
K90定价后引热议闪电降价,雷军:标准版12GB+512GB 版本首销月直降300元
2025年10月23日的红米K90发布会后,12GB+512GB版本原定价为3199元,但因用户反馈该版本与其他配置差价过大
2025-10-24 15:57:00
iPhone 17系列首批用户反应褪色? 苹果官方客服回应
近日,部分苹果 iPhone 17 Pro 及 iPhone 17 Pro Max 的首批用户在社交平台反映,其设备遭遇了机身褪色问题
2025-10-24 15:59:00
阿里夸克AI眼镜开启预售 体验者:轻若无物,稳如长在脸上“看一眼”就能支付
阿里巴巴首款自研AI眼镜——夸克AI眼镜24日0时在夸克智能设备天猫旗舰店开启预售。88VIP会员实际到手价为3699元
2025-10-24 16:35:00
河北新闻网讯(梁轩轩)“原以为开业办税很繁琐,没想到这么简单!”近日,石家庄市桥西区律吕五金产品商行法人柴浩在桥西区税务局办税大厅完成税务申报后
2025-10-24 16:59:00
近日,瑞众人寿河北分公司在保定举办了2025年嘉年华客服节系列活动之“养老规划线下体验日”活动,通过创新融合中医药文化
2025-10-24 17:06:00
“尖货”频出!临安这里科技含量UpUpUp
是一场什么样的比赛技术“尖货”频出“硬核”创新不断近日,2025“海康创行・瓴创青山”智能物联青山湖科技城高层次人才创业大赛第二期
2025-10-24 17:07:00
日前,邮储银行唐山市分行在其辖内网点全面推广集成化的“智能云柜”系统。该设备功能强大,整合了现金、非现金、凭证管理等逾400项个人业务
2025-10-24 17:08:00
行业领先全场景安装!海尔给“老铁门”装好了智能锁
近年来,智能门锁市场需求快速增长。数据显示,2025年上半年中国智能门锁全渠道销量达897万套,同比增长6.8%。市场火热的同时
2025-10-24 17:09:00