• 我的订阅
  • 科技

CVPR最佳论文:大模型成就端到端自动驾驶|焦点分析

类别:科技 发布时间:2023-06-25 08:52:00 来源:36氪

文丨李安琪

编辑丨李勤

与自动驾驶相关文章,首次获得全球顶级计算机视觉会议CVPR的最佳论文。

6月22日,全球顶级计算机视觉会议CVPR 2023公布了最佳论文等奖项。一篇名为《Planning-oriented Autonomous Driving》(以路径规划为导向的自动驾驶)论文,成功从9155篇投稿、2359篇接收论文、12篇入选最佳论文候选名单中脱颖而出。

这也是近十年来,CVPR会议上第一篇以中国学术机构作为第一单位的最佳论文。该论文由上海人工智能实验室、武汉大学及商汤科技联合完成。

CVPR在学术界及产业界的影响力毋庸置疑,与ICCV、ECCV并列为计算机视觉领域三大顶级会议。全球最聪明的头脑汇聚于此,特斯拉也连续几年在CVPR上公布其自动驾驶技术最新进展。

今年的竞争相当激烈。据公开信息,今年12篇入选最佳论文候选名单机构,不仅有谷歌、Stability AI等人工智能领域顶尖企业,也有上海人工智能实验室、斯坦福大学、康奈尔大学、香港中文大学、香港科技大学、南洋理工大学等研究机构及高校。

而上海人工智能实验室、武汉大学及商汤科技联合获奖的关键在于,提出了一个感知决策一体化的自动驾驶通用大模型UniAD。

大会官方组委会认为,论文提出的端到端感知决策一体框架,融合了多任务联合学习的新范式,使得进行更有效的信息交换,协调感知预测决策,以进一步提升路径规划能力。

这证明了大模型与自动驾驶产业结合的潜力。今年初,ChatGPT的爆火,让机器学习与理解人类语言的能力有了本质飞跃。而大模型,也有望为自动驾驶产业落地指出更清晰的方向。

端到端的自动驾驶大模型UniAD

论文指出,随着深度学习发展,自动驾驶算法被组装成一系列任务,包括目标检测与跟踪、在线建图、轨迹预测、占据栅格预测等子任务。

基于这些子任务,行业有着多种自动驾驶系统框架设计:模块化设计,多任务框架,但两种方案都面临着累积错误或任务协调不足的困扰。

比如自动驾驶公司Waymo、Cruise采用的模块化设计方案,每个独立的模块负责单独的子任务。这种方案具备简化研发团队分工,便于问题回溯,易于调试迭代等优点。但由于将不同任务解耦,各个模块相对于最终的驾驶规划目标存在信息损失问题,且多个模块间优化目标不一致,误差会在模块间传递。

论文认为,多任务框架是更优雅的一种设计方案,代表性企业有美国特斯拉、中国小鹏汽车等。方案中不同任务使用同一个特征提取器,具备便于任务拓展、节省计算资源等优点。但不同任务之间仍存在预测不一致、表征冲突的问题。

CVPR最佳论文:大模型成就端到端自动驾驶|焦点分析

a为模块化设计、b为多任务框架、c1/c2为两种端到端方案、c3为UniAD方案示意 图源论文

相比之下,端到端自动驾驶方案将感知、预测和规划所有节点视为一个整体,但现有的两种端到端方案也还面临挑战。

一种简单的方式直接以传感器信号作为输入、以轨迹/控制作为输出,能够在仿真中取得较好结果,但缺乏可解释性与实际应用安全性,尤其是在复杂的城市道路场景。

另一种方案是,对模型进行显式设计,将整个架构分为感知-预测-规划模块,使其具有部分中间结果表达。但这种方式面临检测结果在模块间不可微导致无法端到端优化,稠密BEV预测时长有限,过去-未来、物体-场景等多维度信息难以高效利用等困难。

因此,本篇论文提出了一个端到端方案Unified Autonomous Driving,即UniAD。上海人工智能实验室指出,UniAD能够成功解决不同任务融合难的问题,从而实现多任务和高性能的关键在于以下两点。

一是多组查询向量的全Transformer 模型:UniAD利用多组 query 实现了全栈 Transformer 的端到端模型,可以从具体 Transformer 的输入输出感受到信息融合。二是以最终“规划”为目标,全部模块通过输出特定的特征来帮助实现最终的目标“规划”。

自动驾驶端到端架构 (UniAD) 的流程 图源论文

从论文来看,UniAD 将感知、预测、规划等三大类主任务、六小类子任务(目标检测、目标跟踪、场景建图、轨迹预测、栅格预测和路径规划)整合到统一的端到端网络框架下。

具体来说,将一系列多摄像头图像输入特征提取器,并通过 BEVFormer 转换为统一的鸟瞰图(BEV)。这部分可以快速替换为其他BEV模型,具有较好可拓展性。

在感知环节中,UniAD的目标检测与跟踪模块可以实现对动态元素的特征提取、帧间物体跟踪;在线建图模块实现了对静态物体的特征提取、实例级地图预测;

在预测模块,UniAD可以实现动静态元素交互与长时序轨迹预测;占据栅格预测模块实现了短时序全场景BEV、实例级预测;

在规划模块,UniAD实现基于自车query的轨迹预测和基于占据栅格的碰撞优化。

论文表示,UniAD 的培训分两个阶段:首先联合训练感知部分,即目标跟踪和建图模块,这将持续几个阶段(在实验中为 6个阶段),然后使用所有感知、预测和规划模块端到端地训练模型20个阶段。

从结果来看,论文表示,在 nuScenes 真实场景数据集下,所有任务均达到领域最佳性能(State-of-the-art),尤其是预测和规划效果远超之前最好方案。其中,多目标跟踪准确率超越SOTA 20%,车道线预测准确率提升30%,预测运动位移和规划的误差则分别降低了38%和28%。

在晴天直行场景中,UniAD 可以感知左前方等待的黑色车辆,预测其未来轨迹(即将左转驶入自车的车道),并立即减速以进行避让,待黑车驶离后再恢复正常速度直行 图源上海人工智能实验室

在雨天转弯场景中,即便面对视野干扰较大且场景复杂的十字路口,UniAD 能通过分割模块生成十字路口的整体道路结构(如右侧 BEV图中的绿色分割结果所示),并完成大幅度的左转 图源上海人工智能实验室

从论文到产业还要多久?

当然,从前瞻学术论文到产业跟进、技术大规模惠普,所需要的时间并不短。

以当下被行业火热讨论的BEV为例。2021年特斯拉首次基于Transformer将摄像头2D图像拼接转化成3D图景,生成鸟瞰图 “Bird's Eye View”,简称“BEV”。这是大模型在自动驾驶感知环节的应用。

两年时间过去,当下国内企业虽已纷纷跟进,但仅有少数几家能拿出先期成果。

而UniAD大模型是更为庞大的、涉及感知、预测、规划的复杂系统工程,其中的技术优化与工程化落地只会比BEV更艰难。

论文本身也指出,协调这样一个具有多个任务的综合系统并非易事,需要大量的计算能力,尤其是经过时间历史训练的计算能力。如何为轻量级部署设计和管理系统值得未来探索。

论文作者之一、上海人工智能实验室青年科学家李弘扬博士表示,UniAD提供了全套关键自动驾驶任务配置,其充分的可解释性、安全性、与多模块的可持续迭代性,是目前为止最具希望实际部署的端到端模型。这套基于视觉的全栈自动驾驶框架,据初步测算,每年节省激光雷达与标注成本可达千万级。

部分玩家已经在行动。据36氪了解,小鹏和理想汽车都在筹备研发全栈端到端自动驾驶方案。“目前效果还不太好,但潜力很大。”有内部人士透露。

总而言之,新的技术的种子已经播下,行业新一轮竞赛也可能已经开始。接下来,就看谁能给出更肥沃的土壤与更恒久的耐心。

文章参考:

1.《Planning-oriented Autonomous Driving》

2.《AIR学术|上海人工智能实验室李弘扬、陈立:端到端自动驾驶算法设计思考》

3.《上海AI实验室联合团队获CVPR最佳论文奖 | CVPR 2023》

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-25 12:46:00

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...,可以迅速地定位在关键区域。为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图
2024-04-11 10:53:00
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购
2024-03-16 18:14:00
浙大毕业生加入马斯克新AI公司,要探索宇宙真相!
...导的人工智能实验室(AILab)。他的研究方向是深度生成模型(deepgenerativemodels),这是一类可以从数据中学习潜在结构和规律
2023-07-16 06:13:00
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...种方法来处理安全强化学习的问题,可以大致分类为基于模型的方法和无模型的方法。1. 基于模型的安全强化学习方法:基于模型的安全强化学习方法通常依赖于对环境的建模,通过利用物理模
2024-10-09 09:51:00
百度2023Q1财报:广告托起高利润,全业务紧急“AI再造” | 焦点分析
...,同比增长48%。同时,这也是3月16日百度发布自研大语言模型文心一言以来,百度在AI新时代的阶段性答卷。百度集团董事长兼CEO李彦宏在2022年9月的世界人工智能大会上指出
2023-05-17 12:29:00
复旦大学-蘑菇车联“自动驾驶人工智能校企联合研究中心”揭牌 进一步深化“车路云一体化”模式
...的AI领域有影响力的国际学术会议ICRA 2023收录。基于AI大模型的“车路云一体化”系统3.0将加速自动驾驶大规模落地此次大会上
2023-12-22 18:37:00
“三巨头”杀疯了!开盘15分钟,微软、苹果、英伟达轮番角逐市值“一哥”!
...在CVPR上将展示50多个项目。其中两篇论文(一篇关于扩散模型的训练动态,另一篇关于自动驾驶汽车的高清地图)入围了CVPR最佳论文奖。项目覆盖了从创意产业到自动驾驶汽车开发、
2024-06-18 09:24:00
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成
2024-11-07 09:53:00
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...生导师 Xinya Du,专注于自然语言处理、深度学习和大语言模型的研究。Xinya Du 的工作发表在包括 ACL
2024-09-26 13:35:00
更多关于科技的资讯:
京东发布2025年春晓计划成绩单:数百万商家入驻,为新商节省数百亿
今日,京东“春晓计划”发布2025年度成绩单,展示了过去一年京东在POP商家扶持与发展方面的亮眼成果。数据显示,该计划吸引超过数百万新商入驻
2026-01-05 11:32:00
科技赋能,绿建出海 解码金螳螂的全球化进阶新路径
在建筑装饰行业面临转型与机遇交织的关键节点,金螳螂已在全球舞台开辟出增长新蓝海。2025年上半年,该公司海外营收同比激增29%
2026-01-05 11:52:00
东南网1月5日讯(福建日报记者 林霞) 4日,工信部公示2025年度中国消费名品名单,福建20个品牌入选。其中,12个品牌入选企业品牌
2026-01-05 13:10:00
从架构师到国家智库成员:呼延正勇的技术攀登与价值创造
近日,信息技术领域传来佳音:西安寰宇卫星测控与数据应用有限公司高级架构工程师呼延正勇正式入选国家财政部评审专家库。这位2023年加入公司的技术专家
2026-01-05 13:25:00
山钢集团以科技创新驱动产业升级 国产AI助力钢铁行业高质量发展
鲁网1月5日讯近日,山东省属企业科技创新生态建设推进会在济南召开,山东钢铁集团凭借多项前沿成果获得表彰。其中,“热连轧高强钢品规快速过渡与稳定轧制智能优化控制技术开发”入选省属企业十大创新成果
2026-01-05 13:25:00
AI赋能科研新征程:盈康大脑IncGPT大模型荣膺“人民匠心技术”
近日,以“匠心铸魂,质启新程”为主题的“2025人民质量发展论坛暨人民匠心品牌宣传展示活动”在京举行。论坛期间,“2025人民匠心品牌宣传展示活动”入选案例发布
2026-01-05 13:28:00
“多比,看镜头!”清晨,杭州临平一家跨境电商公司摄影棚内,员工小吴轻声呼唤阿比西尼亚猫“多比”,爱宠立刻抖擞精神,跃上新款猫爬架舒展身姿
2026-01-05 13:50:00
中新经纬1月5日电 据商务部网站消息,日前,商务部等九部门发布关于实施绿色消费推进行动的通知,提出鼓励购买获得绿色产品认证的绿色智能家电产品
2026-01-05 11:47:00
WowNow即将亮相CES 2026|以AI驱动的柔性制造,探索消费端创意直连制造的新路径
中国创新科技品牌WowNow宣布,将于2026年1月6日至9日亮相在美国拉斯维加斯举办的国际消费电子展(CES 2026)
2026-01-05 11:04:00
国内多筒血拼正酣!海尔三筒洗衣机泰国亮相填补空白
国内三筒洗衣机市场正上演激烈角逐,消费者对分区洗护的需求推动产品快速普及,各大品牌纷纷加码布局,行业竞争持续升级。海尔三筒洗衣机在热销超30万台
2026-01-05 09:52:00
山东移动泰安分公司圆满完成“你好2026”泰山跨年音乐嘉年华通信保障
鲁网1月4日讯2025年12月31日晚,“你好2026”泰山跨年音乐嘉年华在泰安市泰汶吾悦广场西南侧盛大举行,吸引超过两万名乐迷齐聚一堂
2026-01-05 09:55:00
国产新原料赋能产品创新:一支用“牙齿”成分做成的牙膏
近年来,国产科研力量正在持续推动口腔健康科技进步。从材料源头研发到临床研究验证,一系列应用转化研究不仅展示了国产功效型材料的技术潜力
2026-01-05 10:03:00
“手机随时待命、消息秒回”——新兴职业“秒回师”以其即时响应与情感陪伴的特点,吸引了不少年轻人加入。与此同时,代遛宠物专员
2026-01-05 08:36:00
■王哲娟摘要:在数字化与知识经济时代,企业的竞争边界不断扩展,组织间的关系由单向依附转向多层协同。协同创新成为企业嵌入生态系统
2026-01-05 05:42:00
东南网龙岩1月4日讯(通讯员 詹春艳 林培民)近日,龙岩市新罗区10千伏中新线上空,一场静默而精准的“人机协同”带电作业悄然完成
2026-01-04 23:27:00