• 我的订阅
  • 科技

对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发

类别:科技 发布时间:2025-02-27 11:36:00 来源:搜狐科技

搜狐科技高端访谈栏目《1号位》与知名企业家、公司高管展开深度对话,本期我们邀请到商汤科技联合创始人&首席科学家、商汤绝影CEO王晓刚。

对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发

出品 | 搜狐科技

作者 | 梁昌均

编辑 | 杨锦

“今年会是加速发展年,市场将迎来爆发。”

在近日举行的全球开发者先锋大会期间,搜狐科技对话了商汤科技联合创始人&首席科学家、商汤绝影CEO王晓刚,这是他对自动驾驶商业化做出的最新判断。

他做出这个判断的依据主要有两点,一是自动驾驶已经下沉到十万元以下的车型,行业迎来市场爆发期和拐点。

另外一个,就是技术的发展。过去两年,自动驾驶厂商和车企,都在追求基于端到端的大模型,使得自动驾驶的能力持续突破。

不过,王晓刚表示,这种端到端路线也有局限,非常依赖数据,且本质仍是模仿学习,很难突破人类驾驶水平的天花板。

但AI技术范式的突破,为自动驾驶技术范式提供了新思路。最近火爆的DeepSeek基于纯强化学习的长思维链涌现,打破了数据瓶颈,为自动驾驶带来了突破可能。

王晓刚认为,有了强化学习的自动驾驶,可以用生成仿真环境的世界模型,跟端到端自动驾驶的模型进行协同交互,可以产生新的技术路线。

这次大会上,商汤绝影发布名为R-UniAD的与世界模型协同交互的端到端自动驾驶技术,其中就采用了强化学习。今年4月,这套方案将在上海车展上车展示。

王晓刚认为,这条新技术路线,能够解决原来数据不够和质量参差不齐的问题,还能够让自动驾驶超越人的驾驶水平,也能解决L3,甚至L4、L5高阶自动驾驶。

不过,他也强调,自动驾驶需要一步步逐渐积累,没有所谓的终极解决方案,大家都是踩在前人的肩膀上往前走,技术会不断演进。

对于不少车企进军火热的机器人,王晓刚表示,两者体系通用,但今天机器人比较像自动驾驶十年前的早期阶段,热度比较高,实际落地还是有距离。

他表示,商汤在机器人领域不是很着急,先把在汽车领域的规模化做好,同时建立好自己的基础能力体系,当有一天能够规模化的时候,能够迅速把握住这个机会。

王晓刚预计,绝影三年内有望盈利,这需要80-100万的年上市量。目前,绝影的智驾方案已量产交付广汽埃安、一汽红旗等车企。

谈及爆红的DeepSeek对AI的发展影响,王晓刚表示,开源的价值非常大,而技术的发展是螺旋式上升,现在算法跑到了高点,但可能下个阶段,数据或算力会上来。

“DeepSeek只是语言大模型,接下来就是多模态。我觉得要找到有价值的、高难度的数据,这样才能产生很多有价值的知识出来。”王晓刚说。

以下是对话精编:

搜狐科技:商汤的世界模型“开悟”,跟杨立昆说的或跟英伟达的世界模型有什么区别?

王晓刚:主要差别是我们聚焦在自动驾驶领域,对模型的要求要做到精准可控。之前所有的世界模型跟端到端模型并没有交互,更多是拿来做数据的生成,现在开悟演进到跟端到端模型有实时在线交互,时空的一致性、时序都要能够保持,要求会更高。

搜狐科技:世界模型本质上是用来解决自动驾驶数据不够的问题?

王晓刚:不光是数据不够,还有数据质量参差不齐的问题。在比较复杂的场景里面,可能80%以上都是不好的数据,这对端到端模型的性能有非常大的影响。

有了强化学习以后,怎么处理呢?一个是模拟仿真,还有一个是reward function(奖励函数),不再是靠规则去筛选。它还可以有超越人类的行为,在复杂场景里可以不停去试,最终能超越人的驾驶水平。

搜狐科技:基于强化学习的世界模型,能让自动驾驶超过人类,新的挑战在哪?

王晓刚:从DeepSeek看,有了强化学习,打破了数据的瓶颈,产生了很多原来没有的知识。它把初中、高中的奥赛题都做完了,怎么再找到更好的问题,就是它进一步发展的瓶颈。模拟仿真跟端到端相结合,难点在于场景库,怎么提供各种复杂的场景。

搜狐科技:有观点认为,对自动驾驶来说,数据不是越多越好,过多的话是干扰,您怎么看?

王晓刚:这就看数据的质量。之前端到端最大的问题是,基于模仿学习的范式让它很难做出超出人类预期的行为表现,其预测和生成的轨迹、驾驶行为模式跟基于规则的预测差不多。

随着像Sora等视频生成的多模态技术突飞猛进,这扇门就能够打开。最终会变成多模态的双向协同,能识别理解和仿真生成,未来的大模型就会成为自闭环的体系。

搜狐科技:为什么想到把强化学习用到自动驾驶里面,从DeepSeek得到的启发?

王晓刚:我们在2018、2019年的时候,已经开始做强化学习。但当时数据仿真、世界模型比较弱,没有办法合成现实用到的数据。今天有了数据视频的生成,能够跟强化学习结合。

搜狐科技:自动驾驶需要很快决策,跟强化学习的推理、长思考能力,看上去好像有些矛盾。

王晓刚:强化学习是在训练阶段,实际部署的时候就没有世界模型的事了,直接是靠端到端来做。DeepSeek不是这样,它是在推理过程当中合成东西,所以中间的步骤还都有。

搜狐科技:自动驾驶原来有很多争议,这两年大家做端到端,有分段式,还有统一大模型。绝影是哪一种?怎么看这两种路线?

王晓刚:我们的R-UniAD是一段式的端到端,通过视频的输入直接输出轨迹。今天说智驾平权,要用更低的硬件成本去做,到底应该采用什么样的方法?就是根据现有条件,和数据、云端算力和终端部署算力相关。

所以有段时间,大家觉得端到端就是最终解决方案,今天看到好像又不是,又有数据的问题,数据多了也不好,很多数据不是好的驾驶行为,所以又有新的技术路径在演进和发展。

搜狐科技:您提到智驾平权,自动驾驶什么时候能迎来ChatGPT时刻,让更多人能用上?

王晓刚:普及的话,我觉得还是要靠已有的更加成熟的技术去完成。这大量还是基于规则,可能部分用到端到端模型,它会让现有的系统变得更好。随着技术演进,去做复杂的场景,就是在探索自动驾驶的上限,投入特别巨大。

搜狐科技:ChatGPT或DeepSeek对AI起到的普及作用,本质上还是因为技术突破。自动驾驶普及较慢,您觉得跟技术有多大关系?

王晓刚:这两个不一样,大模型实现了研发范式的跨越式发展。自动驾驶还是一步步逐渐积累,因为跟安全性相关,要让技术更加成熟,解决更多的问题,让大家对它更加依赖。

今天我觉得实现10万以内车型的渗透,更多还是技术的逐渐累积和打磨。用的人多了,反馈包括数据也会变多,系统更加成熟,而不是突然冒出来某一个产品,变得石破天惊的样子。

搜狐科技:所以自动驾驶出现不了ChatGPT时刻?

王晓刚:这还是一个非常讲究积累的事情,不像DeepSeek,解决问题很好,中间挂机了也没事儿。自动驾驶要经过长时间的实践,投入无数的工程资源,把漏洞补齐,要没有短板。

搜狐科技:前段时间,理想CEO李想说端到端不是自动驾驶的终极路径,只能解决L3,如果想要实现L4,必须用VLA大模型,才能达到泛化能力的要求。

王晓刚:VLA也是端到端智驾方案的一种,R-UniAD本质上也是端到端路线的一种跨越式演进。所谓的端到端,就是在推理阶段省去了中间的各个模块,把各种大模型、决策行为等进行统一集成,VLA比之前的端到端先进一些,但本质都是基于模仿学习的端到端路线,而我们现在发布的是与世界模型协同交互的端到端。

搜狐科技:如果往更高的L3,甚至L4、L5去走,绝影这次发布的方案还能解决吗?

王晓刚:肯定可以。更高阶的问题是在各种复杂的场景里面都能够比较好地处理,我们说的这些方案对场景的覆盖度、处理复杂场景的能力都变强了。

搜狐科技:技术的演化还是挺快,随着AI技术发展,自动驾驶也会衍生出很多不同路线,有没有终极的解决方案?

王晓刚:我觉得倒不是说路线不一样,大家都是在现有技术的基础上不断向前探索,只是步伐快慢的差异。我们做研究的常态,都是踩在前人的肩膀上往前走,很多“终极方案”其实就是相比现在更往前了一步,但技术发展和演化是不会停歇的。

搜狐科技:从L4或L5来看,随着技术往前走,我们距离这个阶段还有多远?

王晓刚:我们是一步一个脚印向着目标前进,R-UniAD是一个跨越式的演进,但也就是脚步迈得更大、更快一些。

L4既需要考虑特定场景的限制,还需要考虑用户体验。首先要确保安全性、接管率经过大规模量产验证,让大家能够放心,再往下一个阶段走。现在用少量量产车在特定场景实现了L4/L5的功能,这不是一个有说服力的论证方式,也不是智驾技术演进应该走的路径。车厂量产会起到非常大的作用,最后要有事实统计来说话。

搜狐科技:您此前提到,自动驾驶盈亏平衡需要三年,您说的是行业,还是绝影?

王晓刚:就是我们公司,如果年上市量达到80万到100万量级,基本上就足够达到盈亏平衡。从行业看,今年会是加速发展年。比亚迪今年目标500万台,其中60%以上有自动驾驶功能。其他各家都在跟进,今年会是市场爆发的年份。

搜狐科技:很多车企去做机器人,技术层面可能有共通之处,商汤会不会去做这块的探索?

王晓刚:它不光是技术,背后这套系统,还有基础设施体系都能共用。我们跟着客户走,车厂在做机器人的时候,我们肯定也可以提供方案。

但这件事并不是很着急,我们先在汽车行业规模化落地。今天机器人比较像自动驾驶十年前的早期阶段,热度比较高,但实际落地还是有距离。我们要做的是建立好自己的基础能力体系,当有一天能够搞规模化的时候,我们能够迅速把握住这个机会。

搜狐科技:DeepSeek出现以后,大家又看到了AI新的可能性。您从学生时代就一直做AI尤其是视觉研究,您怎么看AI的演进?

王晓刚:大模型弥补了原来强化学习的不足,现在反过来了,大模型发展遇到了瓶颈,又把强化学习引进来。所以它不是绝对的概念,是在螺旋式上升。

算法、算力和数据,今天突然觉得好像算力不重要了。这只不过是螺旋上升的时候,算法跑到了高点,本质是能够更好地利用算力了,但下一个阶段算力又会上来。

DeepSeek的启示不光是技术,它还开源。今天在竞争加剧的情况下,让我们看到开源带来的价值和影响力,别人想禁都无从禁起。

搜狐科技:从技术层面来看,您觉得大模型接下来要往哪方面去突破?

王晓刚:螺旋式上升,一旦打开一扇门以后,大家就做各种试错。这边稳定以后,马上加大算力去探上限,包括数据。

DeepSeek只是语言大模型,接下来就是多模态。我觉得接下来要在各个领域里面找到有价值的、高难度的数据,这样才能产生很多有价值的知识出来。返回搜狐,查看更多

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-27 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国的F1与AI都有一股韧劲
...周迎F1中国站首秀,一场科技与速度的跨界对话赛前举行商汤科技董事长兼首席执行官徐立对话中国首位F1赛车手周冠宇(左)。 本报记者 陈龙摄 ■本报记者 沈湫莎再过
2024-04-13 05:40:00
商汤如何玩转大模型+大算力?详解“日日新SenseNova”大模型体系的关键招
...昌均在ChatGPT引发的大模型和生成式AI热潮下,国内AI公司商汤科技也秀出自家肌肉。在4月10日下午的技术交流日上
2023-04-14 14:00:00
世界人工智能大会开幕:马斯克、华为胡厚崑共话AIGC,谷歌、特斯拉展示AI能力
...副总裁、美国国家工程院外籍院士沈向洋与IEEE CEO拉曼,商汤科技CEO徐立与中国科学院院士、清华大学交叉信息研究院院长姚期智等人
2023-07-06 22:00:00
科技周报 | 商汤被曝大裁员、可用眼泪充电的电池问世
...战者”号航天飞机首次实现黑夜发射。··· 产业动态01 商汤被曝大裁员,官方回应:根据自身情况优化人才结构据财新报道,“AI四小龙”之一的商汤科技近日开启新一轮裁员潮,涉及多
2023-08-30 17:39:00
2024北京国际车展|加速智能汽车驶入AGI时代 商汤绝影系列原生态大模型亮相
4月25日,商汤绝影携系列原生态大模型及相关产品矩阵首次亮相2024北京国际车展。作为首个提出感知决策一体化自动驾驶通用模型的公司,商汤绝影在本届车展上首次向公众展示面向量产的真
2024-04-28 21:29:00
科技企业竞逐“大模型”:谁能聊下去?谁更接地气? | 2023世界人工智能大会
...介绍大会相关信息。向“商量”提问 与“秒画”创作在商汤科技的展台,与“士别三日”后的“商量”来“商量商量”吧。记者了解到,“商量”是商汤科技“日日新”大模型体系下的千亿级参数
2023-07-06 09:22:00
未来总有答案!36氪WISE2023 商业之王大会圆满举行
...研究院院长管清友自如COO梁占华 高德地图副总裁董振宁商汤科技联合创始人、西安电子科技大学客座教授、元罗卜智能科技有限公司总裁马堃 创新工场董事长、零一万物CEO李开复,中
2023-11-29 22:41:00
期待F1速度遇上AI速度
...中国人的F1速度。开赛前期,索伯车队的技术合作伙伴、商汤科技董事长兼CEO徐立和周冠宇来了场“坚持原创 做自己的冠军”的跨界对话,共话速度和激情。帮助车手优化策略“当我实现从
2024-04-13 14:04:00
暴走1万步,36氪带你看AI春晚 |直击WAIC 2023
...站在长城墙上,能一览城墙外的高树和墙上的一砖一瓦;商汤则带来了针对篮球运动的智慧篮球场,不用摄影师,就可以记录下投中三分的精彩瞬间;还有人体支架一般的康复机器人、做切割手术的
2023-07-06 20:32:00
更多关于科技的资讯:
万载县株潭中心幼儿园:一物多玩 让材料“活”起来
为帮助教师掌握“一物多玩”核心思想与基础玩法,打破器材固定使用思维,建立“器材为能力服务”的意识,万载县株潭镇中心幼儿园于2025年12月25日下午
2025-12-30 11:14:00
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:17:00
天津市优秀基层理论宣讲员风采展示
2025-12-30 11:18:00
博士创新站典型案例|英利能源发展有限公司博士创新站:产学研协同破局,填补国内光伏质检领域技术空白
在“双碳”战略与光伏产业智能化转型背景下,英利能源联合河北工业大学陈海永博士团队共建博士创新站,成功研发并应用“光伏组件可靠性检测视觉大模型”
2025-12-30 11:40:00
在食品工业转型升级浪潮中,核桃精深加工与高附加值开发是产业高质量发展的关键。河北养元智汇饮品股份有限公司(以下简称“养元公司”)深耕核桃饮品领域多年
2025-12-30 11:40:00
博士创新站典型案例|河北鼎联科技有限公司博士创新站:校企联合攻关,驱动文博文旅产业智变
当前,文博文旅行业在数字化转型中面临数据资源分散、技术标准缺失、国外解决方案主导等瓶颈。河北鼎联科技有限公司联合河北地质大学杨丽花博士团队共建博士创新站
2025-12-30 11:45:00
专访“优秀侍茄师”马慧明: 雪茄爱好者到雪茄文化宣传者的蜕变之路
随着国产雪茄行业的快速发展,一个名为“侍茄师”的职业正悄然从冷门走向台前。他们不仅是雪茄文化的传承者,更是雪茄文化传播的核心力量
2025-12-30 11:50:00
教育与科技相交起舞—临沂联通“云网数智安”赋能区域教育数字化转型
鲁网12月30日讯 (记者 李文静 通讯员 沈慧卿)2025年7月,山东省教育厅等10部门联合印发《山东省“人工智能+教育”实施方案》
2025-12-30 11:52:00
“看不见的手术刀”尽显中国智造锋芒,海扶刀亮相国博中国制造“十四五” 成就展
什么是“看不见的手术刀”?它如何代表中国高端医疗设备制造的锋芒?2025年12月30日起,在中国国家博物馆举行的“筑基强国路——中国制造‘十四五’成就展”上
2025-12-30 13:13:00
薰风KUMPOO亮相广州文交会,共谱运动文化新章
创办于2017年的广州文交会,迄今已成功举办7届,展会规模、成交金额和影响力逐年提升,品牌效应和辐射功能逐步凸显,实现了从无到有
2025-12-30 13:51:00
3亿人参与冰雪运动后,天猫打造“雪上空港”再燃冰雪经济
12月25日,在距离北京市中心200公里的崇礼雪场,天猫打造了一场沉浸式冰雪大秀,在云顶雪场Big Air大跳台,交响乐团现场演奏与专业滑手大跳台专业表演交织
2025-12-30 11:05:00
火炬高新区已培育上百家国家级专精特新“小巨人”企业
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏 陈晓敏)如果要衡量区域的科创硬实力和发展后劲,专精特新“小巨人”企业的集聚度无疑是一个关键指标
2025-12-30 08:16:00
浙江日报讯 (记者 沈超 石磊 共享联盟·金华开发区 俞夏冰) 知识产权路演,是促进创新成果从实验室走向市场的关键一招
2025-12-30 08:39:00
野蛮生长近二十年的充电宝行业,不到半年就掉进了漩涡。据了解,工信部已于10月及11月多次组织召开《移动电源安全技术规范》征求意见稿研讨会
2025-12-30 08:40:00
在贵州省贵阳市的繁华商圈中,一家传统与现代相结合的特殊金融机构正悄然改变着人们对典当行业的刻板印象。贵州中泰星诚典当有限公司凭借其专业化
2025-12-30 08:52:00