• 我的订阅
  • 科技

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

类别:科技 发布时间:2023-02-22 22:00:00 来源:砍柴网

文|邻章

“人们总是在短期高估一两年时间取得的成绩,而低估了五到十年能够取得的进展。”

1997年,IMB的深蓝打败俄罗斯国际象棋大师卡斯帕罗夫。

2016年,谷歌Deepmind的AlphaGo打败了人类围棋九段高手李世石。

2023年初,ChatGPT彻底火爆全球,引发大众狂欢,比尔盖茨的这一判断被一再验证。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

大众的狂欢非常容易理解,因为AI的每一次出手都超过了大众心理预期。同时人们也很容易将人工智能捧上神坛,甚至很多乐观者认为“奇点”将至,悲观者又认为AI替代人类已近在咫尺。

人工智能是一个长周期回报的技术。

过去数十年间,AI技术经历了由专家系统、知识图谱到机器学习,再到深度学习,以及直到今天的大模型阶段。每一次技术跃迁的时间虽然在缩短,但仍然是一个需要前期积累、长期投入的过程。

自动驾驶,这个被誉为人工智能王冠上的明珠,正是随着2012年深度学习技术的突破,才真正迎来产业化的可能。从过去十年进程来看,自动驾驶同样呈现出技术长周期的特征,并不会因为商业、资本、大众的期望而立即实现或者因为遭遇挫折而停滞不前。

一、你有你的计划,我有我的节奏

经过十年技术的演进,自动驾驶迎来这样一个新阶段。

首先是自动驾驶的算法训练正在从深度学习早期的CNN等神经网络模型转向以Attention注意力机制为特征的Transformer大模型的使用,自动驾驶在感知、认知乃至极端场景的仿真训练、大规模数据标注都有大模型参与其中。

其次是围绕大模型训练的云端算力平台,以及与车端多模态、多数量、高质量传感器以及车端算法适配的高算力计算平台也已经纷纷落地,从理论上已经可以支持完全自动驾驶级别的算力要求。

再次是乘用车辅助驾驶迎来爆发期,大规模多传感器、高算力车型的量产落地,使得“数据驱动”技术升级形成闭环,为自动驾驶算法和算力提供了源源不断的燃料。

十年为期,这一数据闭环是如何发生的?

这几乎是留给自动驾驶从业者的最后一道大题了。

目前,行业里优秀的答案,就是特斯拉的Autopilot和FSD。

尽管行业对特斯拉自动驾驶的故事已经非常熟悉,但这里仍然可以提纲挈领地总结几点成功经验。

首先是Autopilot软硬件系统的快速迭代,确保了特斯拉车型实现规模量产的同时,其车端AP系统的数据积累能够保持同样的高速增长。

而且从Autopilot2.0起,其感知系统就标配了8颗摄像头,确保了采集数据的一致性。为后面数据处理的成本打下基础。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

其次是特斯拉车端高端算力芯片的预埋和超算中心Dojo的建设。特斯拉不仅自研了FSD车端大算力芯片,而且实现了车端的预装,并通过软件售卖的模式来实现商业化。这一举措无形中确保车辆具备了实现高阶辅助驾驶的能力。

同时,特斯拉在近两年加快了超算中心的建设,来进一步处理数十亿公里的辅助驾驶的行驶里程数据。这奠定了特斯拉自动驾驶技术的基础设施。

第三就是特斯拉对以Transformer大模型为代表的最新AI技术在自动驾驶上的探索和应用。从连续两年的AI DAY看出,特斯拉找到了让视觉感知能力快速提升的方法,尤其是基于Transformer实现的BEV感知空间,如今已成为当前自动驾驶感知的主流。

简单理解BEV的优势,就是基于BEV空间下的感知结果与决策规划所需的坐标系统是统一的,感知和下游的联系得到进一步增强。

但很快,特斯拉从2D的BEV空间快速提升到带有时序特征的信息,使得FSD系统获得帧间连续的感知结果,从而获得了应对视野盲区和遮挡的能力。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

而到去年,特斯拉又带来了Occupancy Network,使得BEV感知又在高度方向进一步扩展,最终形成了带有4D(时序+3D栅格)结构的场景。通俗讲,这就几乎使得自动驾驶的感知系统实现向人类视觉一样的立体视野,可以更好地预测一般障碍物和运动障碍物的意图、速度等信息。

总之,特斯拉的技术路线以及量产模式为全球自动驾驶行业打出一个“样板”。

二、特斯拉的模式是可以复制的吗?

事实上,是可以的。

如果盘点中国自动驾驶行业,我们可以发现一家非常典型的“特斯拉”路线的自动驾驶公司——毫末智行。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

今年初,毫末智行有两个动作,一个是发布了自动驾驶行业最大的智算中心,另一个则是发布了自动驾驶版的ChatGPT,毫末称之为“DriveGPT”。

DriveGPT实际上是毫末在自动驾驶认知大模型上的成果,其核心是基于真实人驾数据,特别是将人驾接管数据引入大模型当中,持续优化自动驾驶的认知决策模型。

为什么DriveGPT也能称之为“GPT”呢?

首先,GPT是一个大规模的通用预训练大模型,而DriveGPT正是采用了与ChatGPT一样的具有Attention注意力机制的Transformer架构的大模型,其特点是随着模型参数规模、数据规模增加以及训练方法的提升,模型算法的效果也稳步提升,适应性更好。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

其次,DriveGPT与ChatGPT一样,都使用了通过人类反馈的强化学习算法RLHF,都会基于真实数据来训练奖励模型(reward model),最终得到最优结果。不同的是,ChatGPT使用的是人类的语言文本,而DriveGPT使用的是人驾数据。

最后,DriveGPT也和ChatGPT一样,都属于生成式模型,都是基于历史序列预测未来序列,从而能够完成下一步的预测与规划的决策输出。

据透露,毫末目前已经完成DriveGPT的模型搭建和第一阶段数据跑通,现在的参数规模可以对标GPT-2的水平。

事实上,对于毫末智行这样一家自动驾驶初创公司,能够在ChatGPT这种超大模型应用推出之前,就已经开始对于大模型的应用,其技术布局和落地进度已经远超行业认知了。

三、毫末智行是如何将“DriveGPT”练成的?

我们其实可以从刚刚对自动驾驶技术长周期的探索中找到回答这一问题的线索。

第一,毫末用最快速度和最短时间实现了智能辅助驾驶产品的规模量产,同时打通了数据闭环。

要知道,毫末智行仅仅是一家才成立三年多一点的科技公司。入局时间已经是自动驾驶行业跌宕起伏,行至中局的节点。好处是毫末可以避免前面自动驾驶公司踩过的坑,毫末坚定地选择了乘用车辅助驾驶赛道,走渐进式路线,依托长城量产优势,快速实现了L2辅助驾驶的规模落地。

同样,劣势也摆在那里,就是留给毫末进行市场验证的机会没有太多。因此,毫末快速投入了产品的迭代,在21年初推出HPilot1.0之后,很快就推出2.0和3.0产品,并且在3.0产品上实现了类似特斯拉FSD的飞跃式的换代。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

依托1.0和2.0的量产,毫末已经积累了3300多万公里的辅助驾驶里程,并且从官方公布数据来看,已经取得中国各大县市的城区、城市快速路和高速的大规模、多样性的数据。这里应该就包括大量的感知数据和真实人驾数据。

我们也知道,毫末一直以来对外技术布道的一点就是率先推出中国首个自动驾驶数据智能体系MANA。大力投入这一体系建设的目的就是加快数据的使用效率,降低数据使用成本,从而实现毫末所说的“数据驱动”。

第二,毫末以非常前沿的技术视野,率先展开对新型的人工智能技术的研究,并且真正推动这些技术在自动驾驶算法上的落地。这一点几乎可以是与特斯拉同步的。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

从媒体总结的这张图来看,其实就能看到毫末与特斯拉在技术路线上的“异曲同工”。

根据公开资料,毫末从2021年7月,就开始启动对Transformer的研究和落地尝试,成为中国第一家应用Transformer的自动驾驶公司。

在22年9月的AIDAY上,毫末已经表示可以借助Transformer实时建模能力,对多模态融合感知数据进行数据前融合,搭建具有时序特征的立体场景,让自动驾驶系统具有强大实时感知能力,在城市环境中不依赖高精地图的情况下,实现应对道路模糊、复杂路口、环岛等道路感知挑战。

到今年的1月份,毫末已经在自动驾驶各个领域,都在进行基于Transformer结构的大模型的搭建,而且一次发布了五个。

其中,在数据处理上,基于视觉自监督大模型,可以实现对多模态感知数据的大规模自动标注;基于3D重建大模型,可以实现数据生成,通过仿真模拟极端场景,提升感知效果。

在感知端,基于多模态互监督大模型,可以完成一般障碍物以及通用障碍物的识别,更好地提升感知能力;基于动态环境大模型,可以更精准预测道路拓扑关系,帮助车辆更稳定、合理地规划行驶路线。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

在认知端,毫末人驾自监督认知大模型,引入了基于数千万公里的真实驾驶行为数据做预训练,可以使得驾驶策略更加拟人化,同时引入了司机接管数据来不断修正驾驶策略,提升驾驶水平,不断接近优秀人驾水平。

此次升级的DriveGPT正是这一人驾自监督认知大模型的落地应用,接下来DriveGPT会作为云端测评模型,用来评估车端小模型的驾驶决策效果。

第三就是毫末对自动驾驶新阶段自动驾驶技术趋势以及新阶段基础设施的提前布局。

实际上,毫末也在其AI DAY和行业大会上,多次表达了对自动驾驶技术演进趋势的看法。

也就是现在自动驾驶行业正在从小规模数据、小模型的软件驱动的2.0时代向大规模数据、大参数模型为代表的数据驱动的3.0时代的跨越阶段。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

毫末实事求是地将自己定位为“3.0时代的冲刺者”,意味着大模型的探索和布局只是一个开始。

毫末CEO顾维灏曾在去年表示,当前,为应对3.0时代的挑战,整个自动驾驶行业要努力解决这三个问题:

1、通过建设智算中心和优化训练效率,降低大模型的云端训练成本;

2、通过改进车端芯片,定制Transformer专用加速芯片来提升计算效能;

3、通过改进车端模型,通过轻量化模型来提升计算效率。

这些问题会考验很多的从毫末最近公开演讲来看,毫末已经在提出自己的方案。

为打造云端的低碳算力。毫末推出了自动驾驶的第一个智算中心,算力高达 67亿亿次/秒。通过一系列的训练框架、性能、通信等优化,可单机实现训练100亿参数规模的大模型的能力,同时执行多任务、多模态并行的训练,大幅提升计算效率。

回看自动驾驶十年,回答毫末智行DriveGPT是怎样炼成的?

在车端,毫末在探索和关注更适合具有Attention特点的轻量化模型和Transformer加速芯片,减少车端模型的计算量、耗能,同时增加计算效率,从而实现大模型在车端的应用。

总体看,毫末找到了自己通向自动驾驶终局的“通路”。通过量产辅助驾驶的规模量产,积累海量数据,回到云端大模型实现数据的处理和算法的训练,然后,再经过算法的优化和车端部署,实现更好的产品效果,完成数据闭环,形成毫末特色的技术路线。

这是毫末坚定地冲刺自动驾驶3.0时代的勇气所在。

后记:旁观无解,唯有“过河”

看到这里,我们其实对自动驾驶技术的演进逻辑,应该有了一个清晰的认识。

技术的创新从来不会在一夜之间到来,不会像阿拉伯神灯那样许下心愿就可以实现;技术的突破也不会在遇到难关之后就止步,这又不符合人类认知的经验。

人工智能技术本质是什么?它是一种对于人类智慧的模拟地计算,是通过人工系统的方式去模拟人类神经系统的神秘莫测的运作。

自动驾驶本质又是什么?人类驾驶只不过是人脑当中一种非常基础的能力,人一旦学会操控驾驶系统,大脑就很容易进入一种《思考快与慢》当中的“系统1”的运作状态。

如此类比,自动驾驶其实是人工智能较为初阶的应用场景,在今天仍然需要无数聪明的头脑殚精竭虑地去攻克一个又一个智能难题。

而这个解谜的过程,其实别无他法,只能躬身入局。

对于很多站在自动驾驶蓝海岸边的等待者和批评者,我们可以一起回忆下孩童时学过一个叫《小马过河》的寓言故事。

对于自动驾驶,就像故事中的那条河流,它既不会深到难以逾越,也不会轻而易举就能渡过。

它自有其生长的节奏。我们要亲自“过河”。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-22 22:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为、特斯拉带头 车企卷入“大模型”军备竞赛
...大模型等。「大模型上车」目前重点进展:数据标注——特斯拉等公司,通过大模型优化数据标注,降低了人工标注比例和成本;仿真优化——提升虚拟训练环境的真实性,优化虚拟训练数据;优化
2023-06-16 16:48:00
大模型下 自动驾驶企业开始取经特斯拉
两年前,一些企业和特斯拉在自动驾驶的不同技术路线上较劲,现在他们纷纷走上了特斯拉的道路。同时,一种全新的感知范式——BEV+Transformer,已经从特斯拉迅速扩延到更多自动
2023-05-18 16:32:00
特斯拉又有新动作?自动驾驶行业有望迎关键拐点
新能源汽车行业巨头特斯拉又有新动作。在智能驾驶领域,近日有报道表示特斯拉FSD将在中国市场落地,该信息获业内广泛关注,截至目前特斯拉并未辟谣。目前,国内如北京、深圳等多地无人驾驶
2023-08-18 11:03:00
蔚来智能驾驶研发部架构调整,探索端到端大模型?
...示,蔚来此举更多是为了适应大模型发展趋势的研发。“特斯拉FSDV12版本端到端表现出了优秀的自动驾驶能力,自动驾驶AI技术路线已确立。”朱西产认为,汽车产业进入智能化下半场后
2024-06-23 19:46:00
智能驾驶的「 ChatCPT 时刻」,这么近,那么远
最近,身处美国的何小鹏在体验了特斯拉 FSD V12.3.6 后,发出了这样的感叹:「2025 会是完全自动驾驶的 ChatGPT 时刻
2024-06-28 14:06:00
乘风AI大模型 全面自动驾驶加速兑现 马斯克再放豪言的底气从何而来?
在今日的2023世界人工智能大会上,特斯拉CEO马斯克表示,随着人工智能技术快速发展,预计大约在今年年末,便有望实现全面自动驾驶。他坦承,“我之前也做过许多类似的预测,我承认之前
2023-07-06 13:26:00
全球Robotaxi战事升级!谷歌、特斯拉“洋萝卜”发力,中国“土萝卜”需迎头赶上
...o迄今为止筹集的最大一轮融资。不仅仅是Waymo频频发力,特斯拉等“洋萝卜”也对无人驾驶产业虎视眈眈。在10月10日正式推出无人驾驶出租车CyberCab后
2024-11-01 20:31:00
当自动驾驶遇上大模型 机器人加速“直立行走” 这些零部件成未来降本关键
...能”,即能理解、推理、并与物理世界互动的智能系统。特斯拉不久前披露Optimus人形机器人最新进展,机器人展现出不带辅助的行走能力,且能精准做到电机转矩控制,产品力的进步也被
2023-06-18 10:00:00
马斯克:特斯拉正在训练新的FSD模型 可能会在下个月发布
财联社8月6日讯(编辑 牛占林)当地时间周三,特斯拉首席执行官马斯克在社交平台上发文称,该公司目前正在训练一款全新的完全自动驾驶(FSD)模型,可能在下个月底准备好向公众发布。
2025-08-06 21:35:00
更多关于科技的资讯:
本报讯(全媒体记者左阳天)指尖滑动屏幕,货物飞速流转,一场持续了一个多月的年度消费盛宴,正悄然重塑江西消费者的购物车与江西商家的生产线
2025-11-13 06:45:00
新闻纵深|“人机共生”让绿钢更绿
河钢集团石钢公司五十六个智能模型构建“数字工厂”“人机共生”让绿钢更绿阅读提示订单排产从48小时压缩到30分钟,钢水样品2分40秒完成27种元素分析
2025-11-12 08:14:00
厦门网讯(厦门日报记者 沈彦彦)11月11日,京东发布2025年“双11”购物狂欢节(以下简称“双11”)福建消费热点相关情况
2025-11-12 08:22:00
厦门网讯(厦门日报记者 沈彦彦)昨日,抖音美洋官方旗舰店的直播间里热闹非凡,主播“上链接”话音刚落,新品针织衫链接的下单人数瞬间破百
2025-11-12 08:22:00
厦门网讯 (厦门日报记者 邬秀君)顶峰人文影视艺术会客厅项目签约金额20亿元;同文文化艺术影视科技街区项目签约金额16亿元
2025-11-12 08:22:00
厦门网讯 (文/厦门日报记者 谭心怡)在思明区禾祥西路,一个红色小窗口内闪着金元宝形的灯,客人抽完签、摇响铃铛、再把签递进窗口——冰激凌就会从里面递出
2025-11-12 08:22:00
厦门软件园企业:科技赋能 打开光影新视野
借助XR虚拟拍摄技术,可实现场景自由切换。图为厦门火炬元宇宙(XR)公共技术服务平台。(甚妙视觉 供图)厦门网讯 (厦门日报记者 林露虹 通讯员 管轩 雷飏)光影闪耀鹭岛
2025-11-12 08:22:00
●席恺前不久,星巴克以40亿美元出售中国业务60%股权。消息一传出,众人的目光很快聚焦在瑞幸咖啡上:这个总部设在厦门的咖啡品牌
2025-11-12 08:22:00
鲁网11月11日讯(记者 赵洪斌 吴美琳)11月11日,德州扒鸡®美食城三八路店重装开业,焕新启幕,美耀州城!溯源四十载
2025-11-12 08:43:00
立冬时节,寒意逐渐加重。11月7日,记者走进沧州热力有限公司热网调度中心,只见一块覆盖整面墙壁的智慧大屏格外醒目,沧州智慧热力管理平台正高效运行
2025-11-12 08:57:00
记者走基层|雄安图书馆迎来“新员工”
机器人馆员与小读者热情对话互动,数字人馆员“图小安”为读者推荐书籍,“爱心智送”机器人载着图书穿梭在图书馆内,无人驾驶送书车定时出发往雄安人工智能产业园等点位送书……11月3日
2025-11-12 08:59:00
2025网聚美好安徽 |“多面手”“大力士”……江淮前沿技术协同创新中心机器人“天团”来了
大皖新闻讯 11月11日,“皖美十四五 再启新征程”2025网聚美好安徽网络主题活动来到江淮前沿技术协同创新中心,采访团在这里邂逅了许多形态各异
2025-11-12 09:01:00
从秸秆到新材料,圣泉“链”就产业生态新格局|链上济南项新行
编者按:“十五五”规划建议中提出,提升产业链自主可控水平,强化产业基础再造和重大技术装备攻关,滚动实施制造业重点产业链高质量发展行动
2025-11-12 09:19:00
2025青岛虚拟现实创新大会|中科曙光:为“VR+AI”构筑强大、稳定、绿色的算力基石
鲁网11月11日讯 (记者 刘亮亮 刘晓伟)如果说VR/AR构建了通往数字世界的“大门和窗口”,那么AI就是让这个世界变得“可感知
2025-11-12 09:22:00
知名作家张德芬入选福布斯中国华人精英 Top100
近日,知名畅销书作家张德芬,凭借在心理学研究深耕、教育普及落地及文化出海传播三大领域的卓越成就,成功荣登 “2025 福布斯中国最具影响力华人精英TOP100” 榜单
2025-11-12 10:03:00