我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

CVPR最佳论文：大模型成就端到端自动驾驶｜焦点分析

类别：科技发布时间：2023-06-25 08:52:00 来源：36氪

文丨李安琪

编辑丨李勤

与自动驾驶相关文章，首次获得全球顶级计算机视觉会议CVPR的最佳论文。

6月22日，全球顶级计算机视觉会议CVPR 2023公布了最佳论文等奖项。一篇名为《Planning-oriented Autonomous Driving》（以路径规划为导向的自动驾驶）论文，成功从9155篇投稿、2359篇接收论文、12篇入选最佳论文候选名单中脱颖而出。

这也是近十年来，CVPR会议上第一篇以中国学术机构作为第一单位的最佳论文。该论文由上海人工智能实验室、武汉大学及商汤科技联合完成。

CVPR在学术界及产业界的影响力毋庸置疑，与ICCV、ECCV并列为计算机视觉领域三大顶级会议。全球最聪明的头脑汇聚于此，特斯拉也连续几年在CVPR上公布其自动驾驶技术最新进展。

今年的竞争相当激烈。据公开信息，今年12篇入选最佳论文候选名单机构，不仅有谷歌、Stability AI等人工智能领域顶尖企业，也有上海人工智能实验室、斯坦福大学、康奈尔大学、香港中文大学、香港科技大学、南洋理工大学等研究机构及高校。

而上海人工智能实验室、武汉大学及商汤科技联合获奖的关键在于，提出了一个感知决策一体化的自动驾驶通用大模型UniAD。

大会官方组委会认为，论文提出的端到端感知决策一体框架，融合了多任务联合学习的新范式，使得进行更有效的信息交换，协调感知预测决策，以进一步提升路径规划能力。

这证明了大模型与自动驾驶产业结合的潜力。今年初，ChatGPT的爆火，让机器学习与理解人类语言的能力有了本质飞跃。而大模型，也有望为自动驾驶产业落地指出更清晰的方向。

端到端的自动驾驶大模型UniAD

论文指出，随着深度学习发展，自动驾驶算法被组装成一系列任务，包括目标检测与跟踪、在线建图、轨迹预测、占据栅格预测等子任务。

基于这些子任务，行业有着多种自动驾驶系统框架设计：模块化设计，多任务框架，但两种方案都面临着累积错误或任务协调不足的困扰。

比如自动驾驶公司Waymo、Cruise采用的模块化设计方案，每个独立的模块负责单独的子任务。这种方案具备简化研发团队分工，便于问题回溯，易于调试迭代等优点。但由于将不同任务解耦，各个模块相对于最终的驾驶规划目标存在信息损失问题，且多个模块间优化目标不一致，误差会在模块间传递。

论文认为，多任务框架是更优雅的一种设计方案，代表性企业有美国特斯拉、中国小鹏汽车等。方案中不同任务使用同一个特征提取器，具备便于任务拓展、节省计算资源等优点。但不同任务之间仍存在预测不一致、表征冲突的问题。

a为模块化设计、b为多任务框架、c1/c2为两种端到端方案、c3为UniAD方案示意图源论文

相比之下，端到端自动驾驶方案将感知、预测和规划所有节点视为一个整体，但现有的两种端到端方案也还面临挑战。

一种简单的方式直接以传感器信号作为输入、以轨迹/控制作为输出，能够在仿真中取得较好结果，但缺乏可解释性与实际应用安全性，尤其是在复杂的城市道路场景。

另一种方案是，对模型进行显式设计，将整个架构分为感知-预测-规划模块，使其具有部分中间结果表达。但这种方式面临检测结果在模块间不可微导致无法端到端优化，稠密BEV预测时长有限，过去-未来、物体-场景等多维度信息难以高效利用等困难。

因此，本篇论文提出了一个端到端方案Unified Autonomous Driving，即UniAD。上海人工智能实验室指出，UniAD能够成功解决不同任务融合难的问题，从而实现多任务和高性能的关键在于以下两点。

一是多组查询向量的全Transformer 模型：UniAD利用多组 query 实现了全栈 Transformer 的端到端模型，可以从具体 Transformer 的输入输出感受到信息融合。二是以最终“规划”为目标，全部模块通过输出特定的特征来帮助实现最终的目标“规划”。

自动驾驶端到端架构 (UniAD) 的流程图源论文

从论文来看，UniAD 将感知、预测、规划等三大类主任务、六小类子任务（目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划）整合到统一的端到端网络框架下。

具体来说，将一系列多摄像头图像输入特征提取器，并通过 BEVFormer 转换为统一的鸟瞰图（BEV）。这部分可以快速替换为其他BEV模型，具有较好可拓展性。

在感知环节中，UniAD的目标检测与跟踪模块可以实现对动态元素的特征提取、帧间物体跟踪；在线建图模块实现了对静态物体的特征提取、实例级地图预测；

在预测模块，UniAD可以实现动静态元素交互与长时序轨迹预测；占据栅格预测模块实现了短时序全场景BEV、实例级预测；

在规划模块，UniAD实现基于自车query的轨迹预测和基于占据栅格的碰撞优化。

论文表示，UniAD 的培训分两个阶段：首先联合训练感知部分，即目标跟踪和建图模块，这将持续几个阶段（在实验中为 6个阶段），然后使用所有感知、预测和规划模块端到端地训练模型20个阶段。

从结果来看，论文表示，在 nuScenes 真实场景数据集下，所有任务均达到领域最佳性能（State-of-the-art），尤其是预测和规划效果远超之前最好方案。其中，多目标跟踪准确率超越SOTA 20%，车道线预测准确率提升30%，预测运动位移和规划的误差则分别降低了38%和28%。

在晴天直行场景中，UniAD 可以感知左前方等待的黑色车辆，预测其未来轨迹（即将左转驶入自车的车道），并立即减速以进行避让，待黑车驶离后再恢复正常速度直行图源上海人工智能实验室

在雨天转弯场景中，即便面对视野干扰较大且场景复杂的十字路口，UniAD 能通过分割模块生成十字路口的整体道路结构（如右侧 BEV图中的绿色分割结果所示），并完成大幅度的左转图源上海人工智能实验室

从论文到产业还要多久？

当然，从前瞻学术论文到产业跟进、技术大规模惠普，所需要的时间并不短。

以当下被行业火热讨论的BEV为例。2021年特斯拉首次基于Transformer将摄像头2D图像拼接转化成3D图景，生成鸟瞰图 “Bird's Eye View”，简称“BEV”。这是大模型在自动驾驶感知环节的应用。

两年时间过去，当下国内企业虽已纷纷跟进，但仅有少数几家能拿出先期成果。

而UniAD大模型是更为庞大的、涉及感知、预测、规划的复杂系统工程，其中的技术优化与工程化落地只会比BEV更艰难。

论文本身也指出，协调这样一个具有多个任务的综合系统并非易事，需要大量的计算能力，尤其是经过时间历史训练的计算能力。如何为轻量级部署设计和管理系统值得未来探索。

论文作者之一、上海人工智能实验室青年科学家李弘扬博士表示，UniAD提供了全套关键自动驾驶任务配置，其充分的可解释性、安全性、与多模块的可持续迭代性，是目前为止最具希望实际部署的端到端模型。这套基于视觉的全栈自动驾驶框架，据初步测算，每年节省激光雷达与标注成本可达千万级。

部分玩家已经在行动。据36氪了解，小鹏和理想汽车都在筹备研发全栈端到端自动驾驶方案。“目前效果还不太好，但潜力很大。”有内部人士透露。

总而言之，新的技术的种子已经播下，行业新一轮竞赛也可能已经开始。接下来，就看谁能给出更肥沃的土壤与更恒久的耐心。

文章参考：

1.《Planning-oriented Autonomous Driving》

2.《AIR学术｜上海人工智能实验室李弘扬、陈立：端到端自动驾驶算法设计思考》

3.《上海AI实验室联合团队获CVPR最佳论文奖 | CVPR 2023》

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-06-25 12:46:00

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,驾驶,成就,焦点,分析,论文的资讯：

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...，可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性，该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域，他们将其作为一个掩码来调整原始图

2024-04-11 10:53:00

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购

2024-03-16 18:14:00

浙大毕业生加入马斯克新AI公司，要探索宇宙真相！

...导的人工智能实验室（AILab）。他的研究方向是深度生成模型（deepgenerativemodels），这是一类可以从数据中学习潜在结构和规律

2023-07-16 06:13:00

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...种方法来处理安全强化学习的问题，可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法：基于模型的安全强化学习方法通常依赖于对环境的建模，通过利用物理模

2024-10-09 09:51:00

百度2023Q1财报：广告托起高利润，全业务紧急“AI再造”

...，同比增长48%。同时，这也是3月16日百度发布自研大语言模型文心一言以来，百度在AI新时代的阶段性答卷。百度集团董事长兼CEO李彦宏在2022年9月的世界人工智能大会上指出

2023-05-17 12:29:00

复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”揭牌

...的AI领域有影响力的国际学术会议ICRA 2023收录。基于AI大模型的“车路云一体化”系统3.0将加速自动驾驶大规模落地此次大会上

2023-12-22 18:37:00

“三巨头”杀疯了！开盘15分钟，微软、苹果、英伟达轮番角逐市

...在CVPR上将展示50多个项目。其中两篇论文（一篇关于扩散模型的训练动态，另一篇关于自动驾驶汽车的高清地图）入围了CVPR最佳论文奖。项目覆盖了从创意产业到自动驾驶汽车开发、

2024-06-18 09:24:00

下载次数破39万！CMU、Meta联合发布VQAScore文

【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成

2024-11-07 09:53:00

自动化机器学习研究MLR-Copilot：利用大型语言模型进

...生导师 Xinya Du，专注于自然语言处理、深度学习和大语言模型的研究。Xinya Du 的工作发表在包括 ACL

2024-09-26 13:35:00

更多关于科技的资讯：

新春“一句话下单”近2亿次杭州AI消费热力出圈

这个春节，你领千问红包了吗？杭州的消费市场不仅有浓浓的烟火气，更增添了满满的科技范。刚刚过去的春节假期，阿里巴巴千问App“春节请客计划”掀起的AI消费热潮

2026-03-02 06:54:00

乘势而起，打造生物医药创新高地

德适生物生产人员对KayoFlow自动细胞收获仪进行系统测试。记者步恩撒摄新兴产业，往往决定着一座城市未来的发展高度

2026-03-02 07:55:00

城西科创大走廊全力打造杭州人工智能第一城核心引擎 2025年

全国人工智能创新发展第一城，是杭州向世界递出的崭新名片。作为全省创新引擎的杭州城西科创大走廊，正以前所未有的力度抢占人工智能发展高地

2026-03-02 07:55:00

迈杰模具提升产品交付量

2月27日，山西转型综改示范区入区企业山西迈杰模具制造有限公司机械加工车间、冲压调试及焊装车间一片热火朝天的生产场景——机器的轰鸣声与员工们的专注身影

2026-03-01 20:19:00

启动半月太原超30万张发票中奖

小发票、大活力。市民参与“有奖发票”热情如潮水般奔涌攀升，消费市场焕发出勃勃生机。数据显示，活动启动半个月，已累计有303424张发票中奖

2026-03-01 20:20:00

兴业银行开通全国金融行业首条跨省量子OTN专线环网

鲁网3月1日讯日前，兴业银行联合中国电信成功开通全国金融行业首条跨省量子OTN（Optical Transport Network

2026-03-01 17:33:00

养老康复师、整理收纳师持续走热 58到家启动“50万阿姨招募

春节过后，家庭服务消费迅速升温。58到家数据显示，节后找保姆需求订单量超过1月同期2倍以上，同比增长36%；北上广深等一线城市需求月环比增长超87%

2026-03-01 15:07:00

万联易达集团推出新型物流撮合交易平台“易达宝”

在全产业链供应链中，物流成本正在从“可优化项”蜕变为利润的隐形绞索，信息不对称与交易机制失衡导致物流成本层层加码。货主企业为找车需耗费大量时间成本和会员费等隐性支出

2026-03-01 15:09:00

奥托博克唯一线上官方旗舰授权落地京东健康共助罕见病患者“步

在2月28日国际罕见病日到来之际，京东健康与全球知名康复品牌奥托博克（Ottobock）的合作迈出坚实一步。针对腓骨肌萎缩症（Charcot-Marie-Tooth disease

2026-03-01 15:11:00

今年5月全球机器人将在杭州“同台竞技”

人形机器人在生产线上搬运物料国家机器人检测与评定中心供图都市快报讯昨天，2026杭州国际具身机器人场景应用大赛宣布

2026-03-01 08:35:00

“杭州第四狗”专往“要命”的地方跑

30天连融三轮，5亿订单在手节后第一周，杭州四足机器人赛道就传来一阵密集的“脚步声”。2月26日，具微科技宣布完成超亿美元A++轮融资

2026-03-01 08:35:00

西湖区新春第一会盯上创新生态

商报讯近日，西湖区召开“新春第一会”，探索“顾问式”服务，为建设一流创新生态再出新招。据介绍，2026年，西湖区锚定科创

2026-03-01 08:35:00

百度入局杭州为什么选择上城区？

昨天，百度智能云项目签约落地上城区。北京百度网讯科技有限公司将与上城区携手共建百度智能云千帆大模型（杭州）产业创新中心

2026-03-01 08:35:00

秦皇岛市海港区：智能机器人上岗服务游客

今年春节，秦皇岛市海港区一旅游景点“上新”智能机器人，该款机器人通过特色舞蹈表演、人机互动等形式，为游客提供表演、人机互动、海洋向导、天气预报等服务，让游客在欢声笑语中感受科技的

2026-03-01 10:32:00

杭州又一机器人大赛定档5月

商报讯又一机器人赛事即将开赛——5月15日至16日，2026杭州国际具身机器人场景应用大赛将在杭州云栖小镇会展中心和双浦机器人测试训练场举行

2026-03-01 08:35:00

头条订阅服务

CVPR最佳论文：大模型成就端到端自动驾驶｜焦点分析