• 我的订阅
  • 科技

“AI春晚”背后的故事

类别:科技 发布时间:2024-06-16 23:38:00 来源:北京商报

算力消耗高、幻觉问题棘手、多模态原生统一难……大模型轰轰烈烈发展至今,仍然面临技术上的诸多挑战。瞄准这些“痛点”,智源研究院放了个大招。在北京智源大会上,涵盖大语言模型、多模态大模型、具身智能大模型以及生物计算大模型的“智源大模型全家桶”面世。智源研究院院长王仲远曾给智源的研究作出过一个高度概括——各家企业都在尝试的、已经相对成熟的技术路线,智源不做。智源要做的是攻克大模型的核心关键痛点,是解决行业前沿的技术难题。

“靶向”创新

“AI的尽头是算力,算力的尽头是电力。”而这一切也建立在一个不可避免的场景上,大模型约等于大算力,过往席卷全球的“算力荒”情况足以说明一二。

为解决这一问题,6月14日,智源研究院和中国电信人工智能研究院(TeleAI)基于模型生长和损失预测等关键技术,联合研发并推出全球首个低碳单体稠密万亿语言模型Tele-FLM-1T。该模型与百亿级的52B版本、千亿级的102B版本共同构成Tele-FLM系列模型。

据了解,Tele-FLM系列模型实现了低碳生长,仅以业界普通训练方案9%的算力资源,基于112台A800服务器,用4个月完成3个模型总计2.3Ttokens的训练,成功训练出万亿稠密模型Tele-FLM-1T。模型训练全程做到了零调整零重试,算力能效高且模型收敛性和稳定性好。

目前,TeleFLM系列模型已经全面开源了52B版本,Tele-FLM-1T版本即将开源。

在接受北京商报等媒体采访时,王仲远说:“Tele-FLM-1T虽然还在训练当中,但它证明了我们的生长技术能够使用很少的算力就达到一个相对不错的结果。另一方面,我们也希望这样一个万亿稠密模型能够促进整个开源社区的发展,让大家不需要从头开始训练万亿参数模型,也就不需要从头解决收敛的问题。”

具身智能

得益于大模型的通用能力,机器人有了注入“灵魂”的可能。王仲远提到,智能体很可能会成为大模型出现爆款应用的一个方向。因为大模型的通用能力意味着可能出现真正意义上的智能助理,如果未来每个人都能拥有这样一个助理,并且足够智能且好用的话,就会催生巨大的产业变革。

但具身智能也面临着实时性、敏捷性等方面的具体挑战。在北京智源大会上,智源研究院具身智能创新中心也分享了在机器人泛化动作执行和智能大小脑决策控制等方面取得的多项世界级突破性成果。

而在分级具身大模型系统方面,智源研究院则研发了能够从失败中重思考、再尝试的铰接物体操作大模型系统SAGE。该系统有效结合了三维视觉小模型对空间几何的精确感知能力和通用图文大模型的通用物体操作知识,使大模型驱动的机器人能够在任务执行失败时重新思考并再次尝试新的交互方式,实现了传统机器人技术无法企及的智能性和鲁棒性。

具身智能泛指人工智能技术尤其是大模型技术与物理世界不同硬件的结合,人形机器人只是具身智能的一种表现形态,即承载具身智能的本体是人形机器人。近来备受资本市场关注的也是这一内涵的人形机器人。

爆发节点

接受采访时,王仲远常强调的一件事就是,智源研究院要做企业没做过的事,要做“不可能”,要做真正的技术突破和原始创新,王仲远说,这是智源的一个重要使命。

对原始创新的追求贯穿于研究始终。比如智源研究院推出的Emu3原生多模态世界模型,就没有采用业界常用的DiT架构,而是采用智源自研的多模态自回归技术路径。

原始创新意味着孤注一掷的押注,也意味着极大的挑战和可能存在的失败风险。王仲远说,原始创新同样遵循科学规律,这就说明存在着失败的可能,“呼吁社会能够给原始创新一个更宽容、更宽松的环境,创新不一定会成功,但即使失败也是非常有意义的失败”。

但大模型自身的发展和外界尤其是普通用户的感知又常常存在着一定的“温差”。对此,王仲远对北京商报记者说:“我们不能高估一次技术革命的速度,也不能低估一次技术革命的深度和广度。几年前我觉得AGI离我们还有四五十年的距离,但现在我觉得这个距离只有四五年,很多时候突破就是一瞬间的事情。而且最后不管是B端的爆发还是C端的杀手级应用,都是一定会到来的,而当绝大部分用户感知到的时候,已经是爆发之后的事情了。”

至于这个爆发的节点,王仲远预测,可能要到GPT-4下一代技术成熟的时候。

北京商报记者 杨月涵

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-17 05:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI重塑南京钢铁产业新图景
...开始,‘冶’则代表着行业属性与重塑。”南钢人工智能研究院院长李瑾彦向记者解读“元冶·钢铁大模型”命名的由来。 近年来,通过自主研发的创新算法与模型体系,南钢打破技术应用瓶颈
2025-08-08 07:14:00
...品更是层出不穷。重庆工商大学成渝地区双城经济圈建设研究院研究员莫远明认为,从DeepSeek到Manus,从深度思考到付诸实践,AI“狂飙”给企业发展带来了前所未有的启示:科
2025-03-11 06:09:00
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...大加快了整个人工智能大模型的发展进程。中国信息通信研究院技术与标准研究所工程师 龚正:以DeepSeek这样的企业为例,近期他们在算法层面的优化使得效率提升,已显著降低了推理
2025-02-26 12:40:00
伏羲大模型亮相:人工智能助力解决次季节和极端天气预测难题
...世博城COP28绿区中国馆举行,会上发布了由上海科学智能研究院、复旦大学和中国国家气候中心联合研发的伏羲次季节大模型。与现有国际权威模型相比,伏羲次季节大模型的预报精度更准、
2023-12-15 09:21:00
...午举行了“人工智能发展与治理专题研讨会”,北京智源研究院创始人、创始理事长张宏江表示,今天大热的多模态大模型未来发展方向一定不光是做视频生成、视频剪辑、拍电影或是生成电视剧。
2024-03-25 20:31:00
Sora为何没能诞生在中国?
...下文信息,生成更符合逻辑的文本。 清华大学智能产业研究院首席研究员聂再清对《中国新闻周刊》解释称,OpenAI进行视频数据训练的一大“秘籍”,就是将不同尺寸、分辨率的视频拆
2024-03-19 05:31:00
本文转自:文汇报清华人工智能研究院孙茂松表示,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三
2023-07-26 06:00:00
争夺下一代人机交互标准制定权 多家厂商宣布大模型免费开放使用
...件也于近期宣布正式向所有用户开放使用。中国信息通信研究院技术与标准研究所工程师 龚正:像DeepSeek等开源模型的崛起,其灵活、低门槛的特性正在重构行业生态,迫使头部玩家必
2025-02-16 08:35:00
...点,各方的投资、研发都热度不减。”北京智源人工智能研究院院长黄铁军说,未来,SegGPT等视觉类通用人工智能将在自动驾驶、机器人等方面有广泛应用。据统计,目前中国10亿级参数
2023-06-27 01:56:00
更多关于科技的资讯:
■方妮摘要:从劳动经济学视角优化战略性人力资源管理,是HR从后台职能部门向价值创造核心引擎转变的重要标志。通过对劳动经济学内涵
2026-01-09 05:02:00
随着消费者对室内空气质量的重视程度不断提升,空气净化器已成为新房装修后的必备家电之一。据中国家用电器协会发布的《2025中国洁净空气设备行业白皮书》显示
2026-01-08 23:38:00
韶音在CES 2026展示智能可穿戴生态布局:从开放式耳机到AI眼镜
在近日举行的CES 2026消费电子展上,全球开放式音频技术引领者Shokz韶音,不仅发布了开放式滤噪耳机OpenFit Pro
2026-01-08 23:40:00
中国蓝新闻讯 前不久,浙江省公布首批96家“科技新小龙”企业名单,涵盖新一代信息技术、生物医药、新材料等前沿领域。这些企业虽年轻
2026-01-08 20:27:00
中国蓝观察丨杭州也要造火箭!看商业航天在浙江开启新篇
中国蓝新闻讯 今天(1月7日),北京箭元科技有限责任公司(以下简称“箭元科技”)中大型液体运载火箭生产试验及总装总测基地正式落地浙江
2026-01-08 20:57:00
多彩贵州网讯鼠标轻点,数十公里外企业的用电异常数据实时呈现,以往需耗时多日现场排查的风险隐患,如今在几分钟内便可被系统自动识别与锁定
2026-01-08 21:59:00
江南时报讯 近年来,丹阳农商银行以“变中求进、守正创新”为主线,加快推进数字化转型,有力促进了数字金融协同发展,为普惠金融服务注入新动力
2026-01-08 22:32:00
合肥“机器人大学”新增“家庭课”:VR手把手教学,三个月“毕业”上岗
大皖新闻讯 家里乱了,谁来整理?这些日常家务,未来可能交给机器人。近日,合肥市具身智能机器人数据采集训练场在原有场景基础上
2026-01-08 18:05:00
三国何以“常青”?灵犀互娱发起游戏行业首个三国文化论坛
1月5日,中国游戏行业首个聚焦三国题材的文化论坛——“常青三国:重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办
2026-01-08 17:01:00
都匀佳速健诊所招新媒体运营 五险一金+弹性工作制
多彩贵州网讯(记者雷小露 裘金鉴) 为进一步扩大品牌影响力,推动科技医疗技术的广泛传播,都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名
2026-01-08 17:05:00
【宅男财经|专家面对面】中新经纬1月7日报道称,蔚来创始人、董事长李斌表示,汽车行业和AI行业都在抢铜、银等原材料,原材料涨价还没有传导到终端售价
2026-01-08 14:13:00
中新经纬1月8日电 (谢婧雯)8日,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股116.20港元。智谱开盘价报120港元/股
2026-01-08 14:13:00
记者昨日从中国科学院获悉,“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展,神舟二十一号航天员乘组共同在轨操作该项目实验
2026-01-08 15:08:00
上海晶珩ED-HMI3120:树莓派让工业控制可视化更简单
HMI3120工业人机界面是上海晶珩(EDATEC)最新推出的产品系列,内置树莓派CM5计算平台,融合了高性能处理能力
2026-01-08 15:23:00
26年深耕·千万青年共创:学院奖,链接青年力量与商业未来
当茅台王子酒的“王子音乐节”在高校掀起青春热潮,当可比克实践赛涌现出上千份青年创意实战方案,当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度
2026-01-08 15:25:00