• 我的订阅
  • 科技

“AI春晚”背后的故事

类别:科技 发布时间:2024-06-16 23:38:00 来源:北京商报

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型以及生物计算大模型的“智源大模型全家桶”面世。智源研究院院长王仲远曾给智源的研究作出过一个高度概括——各家企业都在尝试的、已经相对成熟的技术路线,智源不做。智源要做的是攻克大模型的核心关键痛点,是解决行业前沿的技术难题。

“靶向”创新

“AI的尽头是算力,算力的尽头是电力。”而这一切也建立在一个不可避免的场景上,大模型约等于大算力,过往席卷全球的“算力荒”情况足以说明一二。

为解决这一问题,6月14日,智源研究院和中国电信人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型Tele-FLM-1T。该模型与百亿级的52B版本、千亿级的102B版本共同构成Tele-FLM系列模型。

据了解,Tele-FLM系列模型实现了低碳生长,仅以业界普通训练方案9%的算力资源,基于112台A800服务器,用4个月完成3个模型总计2.3Ttokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。模型训练全程做到了零调整零重试,算力能效高且模型收敛性和稳定性好。

目前,TeleFLM系列模型已经全面开源了52B版本,Tele-FLM-1T版本即将开源。

在接受北京商报等媒体采访时,王仲远说:“Tele-FLM-1T虽然还在训练当中,但它证明了我们的生长技术能够使用很少的算力就达到一个相对不错的结果。另一方面,我们也希望这样一个万亿稠密模型能够促进整个开源社区的发展,让大家不需要从头开始训练万亿参数模型,也就不需要从头解决收敛的问题。”

具身智能

得益于大模型的通用能力,机器人有了注入“灵魂”的可能。王仲远提到,智能体很可能会成为大模型出现爆款应用的一个方向。因为大模型的通用能力意味着可能出现真正意义上的智能助理,如果未来每个人都能拥有这样一个助理,并且足够智能且好用的话,就会催生巨大的产业变革。

但具身智能也面临着实时性、敏捷性等方面的具体挑战。在北京智源大会上,智源研究院具身智能创新中心也分享了在机器人泛化动作执行和智能大小脑决策控制等方面取得的多项世界级突破性成果。

而在分级具身大模型系统方面,智源研究院则研发了能够从失败中重思考、再尝试的铰接物体操作大模型系统SAGE。该系统有效结合了三维视觉小模型对空间几何的精确感知能力和通用图文大模型的通用物体操作知识,使大模型驱动的机器人能够在任务执行失败时重新思考并再次尝试新的交互方式,实现了传统机器人技术无法企及的智能性和鲁棒性。

具身智能泛指人工智能技术尤其是大模型技术与物理世界不同硬件的结合,人形机器人只是具身智能的一种表现形态,即承载具身智能的本体是人形机器人。近来备受资本市场关注的也是这一内涵的人形机器人。

爆发节点

接受采访时,王仲远常强调的一件事就是,智源研究院要做企业没做过的事,要做“不可能”,要做真正的技术突破和原始创新,王仲远说,这是智源的一个重要使命。

对原始创新的追求贯穿于研究始终。比如智源研究院推出的Emu3原生多模态世界模型,就没有采用业界常用的DiT架构,而是采用智源自研的多模态自回归技术路径。

原始创新意味着孤注一掷的押注,也意味着极大的挑战和可能存在的失败风险。王仲远说,原始创新同样遵循科学规律,这就说明存在着失败的可能,“呼吁社会能够给原始创新一个更宽容、更宽松的环境,创新不一定会成功,但即使失败也是非常有意义的失败”。

但大模型自身的发展和外界尤其是普通用户的感知又常常存在着一定的“温差”。对此,王仲远对北京商报记者说:“我们不能高估一次技术革命的速度,也不能低估一次技术革命的深度和广度。几年前我觉得AGI离我们还有四五十年的距离,但现在我觉得这个距离只有四五年,很多时候突破就是一瞬间的事情。而且最后不管是B端的爆发还是C端的杀手级应用,都是一定会到来的,而当绝大部分用户感知到的时候,已经是爆发之后的事情了。”

至于这个爆发的节点,王仲远预测,可能要到GPT-4下一代技术成熟的时候。

北京商报记者 杨月涵

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-17 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI重塑南京钢铁产业新图景
...开始,‘冶’则代表着行业属性与重塑。”南钢人工智能研究院院长李瑾彦向记者解读“元冶·钢铁大模型”命名的由来。 近年来,通过自主研发的创新算法与模型体系,南钢打破技术应用瓶颈
2025-08-08 07:14:00
...品更是层出不穷。重庆工商大学成渝地区双城经济圈建设研究院研究员莫远明认为,从DeepSeek到Manus,从深度思考到付诸实践,AI“狂飙”给企业发展带来了前所未有的启示:科
2025-03-11 06:09:00
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...大加快了整个人工智能大模型的发展进程。中国信息通信研究院技术与标准研究所工程师 龚正:以DeepSeek这样的企业为例,近期他们在算法层面的优化使得效率提升,已显著降低了推理
2025-02-26 12:40:00
伏羲大模型亮相:人工智能助力解决次季节和极端天气预测难题
...世博城COP28绿区中国馆举行,会上发布了由上海科学智能研究院、复旦大学和中国国家气候中心联合研发的伏羲次季节大模型。与现有国际权威模型相比,伏羲次季节大模型的预报精度更准、
2023-12-15 09:21:00
...午举行了“人工智能发展与治理专题研讨会”,北京智源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。
2024-03-25 20:31:00
Sora为何没能诞生在中国?
...下文信息,生成更符合逻辑的文本。 清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆
2024-03-19 05:31:00
本文转自:文汇报清华人工智能研究院孙茂松表示,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三
2023-07-26 06:00:00
争夺下一代人机交互标准制定权 多家厂商宣布大模型免费开放使用
...件也于近期宣布正式向所有用户开放使用。中国信息通信研究院技术与标准研究所工程师 龚正:像DeepSeek等开源模型的崛起,其灵活、低门槛的特性正在重构行业生态,迫使头部玩家必
2025-02-16 08:35:00
...点,各方的投资、研发都热度不减。”北京智源人工智能研究院院长黄铁军说,未来,SegGPT等视觉类通用人工智能将在自动驾驶、机器人等方面有广泛应用。据统计,目前中国10亿级参数
2023-06-27 01:56:00
更多关于科技的资讯:
双城耀国庆 绮梦筑新章——恐龙园集团文旅产品“出圈”更“出彩”
今年国庆、中秋假期恐龙园集团旗下环球恐龙城与东方盐湖城凭借全新业态与沉浸式体验双双跻身长三角文旅“顶流”双节期间,约62
2025-10-09 21:49:00
NBA中国携手阿里云开启多年合作,球迷互动体验新惊喜在哪?
10月9日,NBA中国和阿里云宣布达成多年合作,阿里云将正式成为NBA中国官方云计算与人工智能合作伙伴,基于通义千问大模型和云计算基础设施
2025-10-09 22:19:00
获充换电大会官方推荐及星级认证, 公牛充电桩全场景方案引关注
9月27日至29日,2025中国汽车充换电生态大会在合肥举行,此次大会由国家能源局电力司、安徽省汽车办、中国汽车工业协会共同指导
2025-10-09 17:04:00
“北京榜样•最美互联网从业者”提名人选|我爱我家陈少亮:数字浪潮中的筑梦人
2025年的北京,秋阳穿过写字楼玻璃幕墙,在键盘上投下斑驳光影。在我爱我家集团总部技术中心,陈少亮正盯着屏幕上的数据流图
2025-10-09 17:05:00
中新经纬10月9日电 工信部网站9日消息,工业和信息化部、国家标准化管理委员会近期联合发布《云计算综合标准化体系建设指南(2025版)》(下称《指南》)
2025-10-09 13:06:00
当下,网络热搜榜单已经成为我们感知世界的一个重要窗口。这个窗口展示的内容是否真实、健康、积极,直接影响着数亿网民的认知判断
2025-10-09 10:31:00
高低2025年国庆中秋双节,中国电影市场成绩亮眼:国庆档总票房破17亿元,10月2日年度总票房达425.02亿元,超2024年全年
2025-10-09 10:49:00
厦门网讯(厦门日报记者 李晓平)如今,拍照不再停留在平面,“一站式”3D人像打印,正让影像“立”起来,成为更多人的选择
2025-10-08 08:12:00
小牛FX风速款首销战报:5小时全渠道销量14252台,以“价值重构”引爆全民抢购潮
2025年9月29日,全球高端智能电动车领导品牌小牛电动正式发布FX风速款首销战报。数据显示,这款被业界称为“价格屠夫”的新品在9月28日首发后
2025-10-08 09:00:00
稳就业 稳企业 稳市场 稳预期|从 “设备制造” 到 “全链服务”:陕西电子长岭电气纺织机电产业的进阶之路
9月29日,由陕西省委宣传部举办的“稳就业、稳企业、稳市场、稳预期”主题媒体行活动,带领陕西多家主流媒体走进陕西电子陕西长岭电气有限责任公司参观考察
2025-10-08 17:51:00
近日,中国物流与采购联合会公布全国第十批5A级供应链服务企业名单,华远国际陆港集团正式通过评审,获评“5A级供应链服务企业”
2025-10-08 18:01:00
货丰价稳、活动密集、销售井喷、消费升级……在这个中秋国庆假期,我市消费市场“热”力值拉满,处处繁荣兴旺、活力十足。10月8日
2025-10-08 18:32:00
佳盛机电乘风而上,今年前8月产值同比增长超38%抢占新赛道,270多名员工假期忙“冲刺”南报网讯(通讯员单维亮记者张希)“我们是智能电网产业链条上的配套企业
2025-10-07 08:41:00
培育壮大十大千亿级产业集群丨十堰臻融:创新与技改“双轮”驱动 产值同比增长30%
十堰广电讯(全媒体记者 何旭 通讯员 胡新)科技创新是提升核心竞争力关键。十堰臻融汽车科技有限公司以智能化装备升级与专利技术研发为双引擎
2025-10-07 20:43:00
沉浸式AR科技盛宴:打造“可触摸”的科普实验室,重构科普新形态
这个国庆去哪玩?中国科学技术馆告诉你!2025年10月1日——10月7日由中国科学技术馆、北京峰火文化科技有限公司、Rokid联合打造的以“探境・AR科技智慧”为主题的AR体验活动正火热开展中
2025-10-07 09:05:00