• 我的订阅
  • 科技

“AI春晚”背后的故事

类别:科技 发布时间:2024-06-16 23:38:00 来源:北京商报

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型以及生物计算大模型的“智源大模型全家桶”面世。智源研究院院长王仲远曾给智源的研究作出过一个高度概括——各家企业都在尝试的、已经相对成熟的技术路线,智源不做。智源要做的是攻克大模型的核心关键痛点,是解决行业前沿的技术难题。

“靶向”创新

“AI的尽头是算力,算力的尽头是电力。”而这一切也建立在一个不可避免的场景上,大模型约等于大算力,过往席卷全球的“算力荒”情况足以说明一二。

为解决这一问题,6月14日,智源研究院和中国电信人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型Tele-FLM-1T。该模型与百亿级的52B版本、千亿级的102B版本共同构成Tele-FLM系列模型。

据了解,Tele-FLM系列模型实现了低碳生长,仅以业界普通训练方案9%的算力资源,基于112台A800服务器,用4个月完成3个模型总计2.3Ttokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。模型训练全程做到了零调整零重试,算力能效高且模型收敛性和稳定性好。

目前,TeleFLM系列模型已经全面开源了52B版本,Tele-FLM-1T版本即将开源。

在接受北京商报等媒体采访时,王仲远说:“Tele-FLM-1T虽然还在训练当中,但它证明了我们的生长技术能够使用很少的算力就达到一个相对不错的结果。另一方面,我们也希望这样一个万亿稠密模型能够促进整个开源社区的发展,让大家不需要从头开始训练万亿参数模型,也就不需要从头解决收敛的问题。”

具身智能

得益于大模型的通用能力,机器人有了注入“灵魂”的可能。王仲远提到,智能体很可能会成为大模型出现爆款应用的一个方向。因为大模型的通用能力意味着可能出现真正意义上的智能助理,如果未来每个人都能拥有这样一个助理,并且足够智能且好用的话,就会催生巨大的产业变革。

但具身智能也面临着实时性、敏捷性等方面的具体挑战。在北京智源大会上,智源研究院具身智能创新中心也分享了在机器人泛化动作执行和智能大小脑决策控制等方面取得的多项世界级突破性成果。

而在分级具身大模型系统方面,智源研究院则研发了能够从失败中重思考、再尝试的铰接物体操作大模型系统SAGE。该系统有效结合了三维视觉小模型对空间几何的精确感知能力和通用图文大模型的通用物体操作知识,使大模型驱动的机器人能够在任务执行失败时重新思考并再次尝试新的交互方式,实现了传统机器人技术无法企及的智能性和鲁棒性。

具身智能泛指人工智能技术尤其是大模型技术与物理世界不同硬件的结合,人形机器人只是具身智能的一种表现形态,即承载具身智能的本体是人形机器人。近来备受资本市场关注的也是这一内涵的人形机器人。

爆发节点

接受采访时,王仲远常强调的一件事就是,智源研究院要做企业没做过的事,要做“不可能”,要做真正的技术突破和原始创新,王仲远说,这是智源的一个重要使命。

对原始创新的追求贯穿于研究始终。比如智源研究院推出的Emu3原生多模态世界模型,就没有采用业界常用的DiT架构,而是采用智源自研的多模态自回归技术路径。

原始创新意味着孤注一掷的押注,也意味着极大的挑战和可能存在的失败风险。王仲远说,原始创新同样遵循科学规律,这就说明存在着失败的可能,“呼吁社会能够给原始创新一个更宽容、更宽松的环境,创新不一定会成功,但即使失败也是非常有意义的失败”。

但大模型自身的发展和外界尤其是普通用户的感知又常常存在着一定的“温差”。对此,王仲远对北京商报记者说:“我们不能高估一次技术革命的速度,也不能低估一次技术革命的深度和广度。几年前我觉得AGI离我们还有四五十年的距离,但现在我觉得这个距离只有四五年,很多时候突破就是一瞬间的事情。而且最后不管是B端的爆发还是C端的杀手级应用,都是一定会到来的,而当绝大部分用户感知到的时候,已经是爆发之后的事情了。”

至于这个爆发的节点,王仲远预测,可能要到GPT-4下一代技术成熟的时候。

北京商报记者 杨月涵

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-17 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI重塑南京钢铁产业新图景
...开始,‘冶’则代表着行业属性与重塑。”南钢人工智能研究院院长李瑾彦向记者解读“元冶·钢铁大模型”命名的由来。 近年来,通过自主研发的创新算法与模型体系,南钢打破技术应用瓶颈
2025-08-08 07:14:00
...品更是层出不穷。重庆工商大学成渝地区双城经济圈建设研究院研究员莫远明认为,从DeepSeek到Manus,从深度思考到付诸实践,AI“狂飙”给企业发展带来了前所未有的启示:科
2025-03-11 06:09:00
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...大加快了整个人工智能大模型的发展进程。中国信息通信研究院技术与标准研究所工程师 龚正:以DeepSeek这样的企业为例,近期他们在算法层面的优化使得效率提升,已显著降低了推理
2025-02-26 12:40:00
伏羲大模型亮相:人工智能助力解决次季节和极端天气预测难题
...世博城COP28绿区中国馆举行,会上发布了由上海科学智能研究院、复旦大学和中国国家气候中心联合研发的伏羲次季节大模型。与现有国际权威模型相比,伏羲次季节大模型的预报精度更准、
2023-12-15 09:21:00
...午举行了“人工智能发展与治理专题研讨会”,北京智源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。
2024-03-25 20:31:00
Sora为何没能诞生在中国?
...下文信息,生成更符合逻辑的文本。 清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆
2024-03-19 05:31:00
本文转自:文汇报清华人工智能研究院孙茂松表示,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三
2023-07-26 06:00:00
争夺下一代人机交互标准制定权 多家厂商宣布大模型免费开放使用
...件也于近期宣布正式向所有用户开放使用。中国信息通信研究院技术与标准研究所工程师 龚正:像DeepSeek等开源模型的崛起,其灵活、低门槛的特性正在重构行业生态,迫使头部玩家必
2025-02-16 08:35:00
...点,各方的投资、研发都热度不减。”北京智源人工智能研究院院长黄铁军说,未来,SegGPT等视觉类通用人工智能将在自动驾驶、机器人等方面有广泛应用。据统计,目前中国10亿级参数
2023-06-27 01:56:00
更多关于科技的资讯:
2月27日,山西转型综改示范区入区企业山西迈杰模具制造有限公司机械加工车间、冲压调试及焊装车间一片热火朝天的生产场景——机器的轰鸣声与员工们的专注身影
2026-03-01 20:19:00
小发票、大活力。市民参与“有奖发票”热情如潮水般奔涌攀升,消费市场焕发出勃勃生机。数据显示,活动启动半个月,已累计有303424张发票中奖
2026-03-01 20:20:00
鲁网3月1日讯日前,兴业银行联合中国电信成功开通全国金融行业首条跨省量子OTN(Optical Transport Network
2026-03-01 17:33:00
养老康复师、整理收纳师持续走热 58到家启动“50万阿姨招募计划”
春节过后,家庭服务消费迅速升温。58到家数据显示,节后找保姆需求订单量超过1月同期2倍以上,同比增长36%;北上广深等一线城市需求月环比增长超87%
2026-03-01 15:07:00
万联易达集团推出新型物流撮合交易平台“易达宝”
在全产业链供应链中,物流成本正在从“可优化项”蜕变为利润的隐形绞索,信息不对称与交易机制失衡导致物流成本层层加码。货主企业为找车需耗费大量时间成本和会员费等隐性支出
2026-03-01 15:09:00
奥托博克唯一线上官方旗舰授权落地京东健康 共助罕见病患者“步履不停”
在2月28日国际罕见病日到来之际,京东健康与全球知名康复品牌奥托博克(Ottobock)的合作迈出坚实一步。针对腓骨肌萎缩症(Charcot-Marie-Tooth disease
2026-03-01 15:11:00
今年5月 全球机器人将在杭州“同台竞技”
人形机器人在生产线上搬运物料 国家机器人检测与评定中心供图都市快报讯 昨天,2026杭州国际具身机器人场景应用大赛宣布
2026-03-01 08:35:00
30天连融三轮,5亿订单在手节后第一周,杭州四足机器人赛道就传来一阵密集的“脚步声”。2月26日,具微科技宣布完成超亿美元A++轮融资
2026-03-01 08:35:00
商报讯 近日,西湖区召开“新春第一会”,探索“顾问式”服务,为建设一流创新生态再出新招。据介绍,2026年,西湖区锚定科创
2026-03-01 08:35:00
昨天,百度智能云项目签约落地上城区。北京百度网讯科技有限公司将与上城区携手共建百度智能云千帆大模型(杭州)产业创新中心
2026-03-01 08:35:00
今年春节,秦皇岛市海港区一旅游景点“上新”智能机器人,该款机器人通过特色舞蹈表演、人机互动等形式,为游客提供表演、人机互动、海洋向导、天气预报等服务,让游客在欢声笑语中感受科技的
2026-03-01 10:32:00
杭州又一机器人大赛 定档5月
商报讯 又一机器人赛事即将开赛——5月15日至16日,2026杭州国际具身机器人场景应用大赛将在杭州云栖小镇会展中心和双浦机器人测试训练场举行
2026-03-01 08:35:00
鲁网2月28日讯冬尽春归,马蹄报喜。2026年迎来史上最长9天春节假期。从装点门庭的年俗好物,到象征团圆的珍馐美馔,涌动着万象更新的消费活力
2026-02-28 22:40:00
在全球经济充满不确定性的时代背景下,企业如何在危机中把握机遇、在变局中实现稳健增长,成为衡量领导者战略能力的重要标尺。作为荷美尔亚太区总裁
2026-02-28 17:17:00
电与未来同行:松下中国在海南开展电能知识可持续科普活动
2026年1月,松下中国来到海南乡村学生身边,在万宁市和乐、莲花、礼纪等地开展可持续教育科普活动。课程活动以“电能”为核心线索
2026-02-28 17:19:00