• 我的订阅
  • 科技

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

类别:科技 发布时间:2024-04-11 10:53:00 来源:DeepTech深科技

近日,清华大学硕士生徐冬阳和所在团队,为了助力自动驾驶技术的进一步发展,他们提出一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

图 | 徐冬阳(来源:徐冬阳)

自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。

为了提高端到端自动驾驶模型的可解释性,该团队首次引入人类驾驶员的注意力机制。

通过预测当前上下文中的驾驶员注意区域,他们将其作为一个掩码来调整原始图像的权重,从而使自动驾驶车辆能够像经验丰富的人类驾驶员一样,具备有效定位和预测潜在风险因素的能力。

预测驾驶员视觉注视区域的引入,不仅为下游决策任务提供更具细粒度的感知特征,从而可以更大程度地保证安全。而且,也让场景理解过程更加接近人类认知,从而能够提高可解释性。

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

(来源:arXiv)

就潜在应用来说:

其一,本次开发的 LVAfusion 模块能被用于配有激光雷达的车上,有望提高多模态大模型的感知融合能力。

其二,本次模型可以和现有多模态大模型结合。

比如,驾驶员注意力机制可以实时输出,让乘客实时观察当前大模型所认为权重较大的板块。

如果乘客认为不合理,可以语音告诉端到端模型,从而实现自动调节,进而实现持续学习和不断优化。

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

端到端自动驾驶好在哪里?

据介绍,自动驾驶包括环境感知、定位、预测、决策、规划及车辆控制等关键环节,通过协调这些模块可以对周围环境进行实时感知和安全导航。

然而,这种系统架构不但代码量巨大、后处理逻辑复杂、后期维护成本高。

而且在实际应用过程中容易出现误差累积的现象,比如前方突然出现行人,由于感知模块的漏检,下游的预测决策模块没有行人的信息输入,可能导致危险的发生。

而端到端自动驾驶则有望解决这个问题。端到端自动驾驶,是指使用深度学习模型直接从原始输入数据(如摄像头图像,激光雷达点云),到控制命令(如方向盘转角、油门和刹车)的转换过程。

该方法试图简化传统的多模块自动驾驶系统,将整个驾驶任务看作是一个从感知到行为的映射问题。

端到端学习的关键优势在于它可以降低系统的复杂性,并有潜力提高泛化能力,因为模型可以被训练来直接处理多种不同的驾驶情况。

并且,多模态端到端自动驾驶通过整合来自摄像头、激光雷达和雷达等多种传感器的数据,有望提高系统对复杂环境的理解和反应能力,增强决策的准确性和鲁棒性,从而提升自动驾驶车辆的安全性和可靠性。

然而,端到端自动驾驶基于黑盒化的深度学习模型,因此如何提高模型的驾驶性能、以及提高模型的可解释性,是一个急需解决的问题和痛点。

现有的大量方法都是端到端自动驾驶,徐冬阳和所在团队详细分析模型结构之后发现,此前人们并没有很好地利用多模态信息。

摄像头具有丰富的语义信息,但是缺乏深度信息。激光雷达可以提供很好的距离信息。因此,二者具有很好的互补特性。

但是,现有端到端学习方法大部分采用骨干网络分别提取模态信息之后,在高维空间里面进行拼接,或采用 Transformer 针对多模态信息进行融合。

其中,查询 Query 是随机初始化的,这个过程可能导致在采用注意力机制进行融合的过程中,无法利用埋藏在多模态特征中的先验知识。

进而可能会导致跨多种模态的同一个关键对象的错位,最终导致模型学习的收敛速度变慢和次优。

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

中关村的雪天冬夜里,敲着代码做实验

研究中,随着徐冬阳专业技能的积累、以及端到端自动驾驶的发展,在阅读文献时他发现了端到端领域仍然存在一些不足。

比如,没有充分探究是否融合了多模态信息,如何在保证精度的前提下提高模型的可解释性。一番研究之后,徐冬阳选择了端到端自动驾驶作为研究课题。

端到端自动驾驶是一个很大的系统,包括感知、跟踪、预测、决策、规划、控制等多个模块。因此,要设计一个可以有效串通上述模块的方法。

确定好方法之后,则需要采集大量的数据。因为端到端模型都是基于深度学习,因此需要大量数据进行训练。

还得确定模型需要什么输入和输出,以及去自动驾驶仿真平台 Carla 采集多种天气、多种工况之下的数据,同时还要检查数据的完整性。

完成数据采集之后,则要分析模型在结构设计上,能否对本次任务起到帮助。

实验中,在导入预训练权重的时候,徐冬阳把权重导错了一个。但是,由于经过了权重匹配,因此系统并没有报错,然而跑出来的实验结果总是不尽人意。

进行大量的模型调试之后,也依旧没有找到问题所在。一天晚上徐冬阳在中关村散步的时候,天上飘着大雪,他忽然想到自己还没有查看训练代码,会不会是训练过程的问题呢?

于是,他立马跑回电脑旁,看了一下训练过程,最终确定问题出在预训练权重导入上。

调整之后,实验结果非常符合预期。“这种发现带来的不仅是对于问题的理解,更有一种深刻的满足感和成就感。”徐冬阳说。

而由于训练时间比较长,徐冬阳每天晚上都会将多个任务提交到训练集群上。有一天晚上由于交的实验较多,有些任务由于优先级的原因被停了。

第二天来看的时候,他发现少了一些实验结果,于是只得再次仔细分析结果,并将缺失的实验重新提交。

就在这样繁复的过程之中,他终于完成了研究。最终,相关论文以《M2DA:融合驾驶员注意力的多模式融合 Transformer》(M2DA:Multi-Modal Fusion Transformer Incorporating Driver Attention for Autonomous Driving)为题发在 arXiv 上[1]。

科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知

图 | 相关论文(来源:arXiv)

后续,课题组会围绕进一步优化模型、拓展应用场景、提高系统鲁棒性和安全性开展。

具体来说:

首先,要深化多模态融合技术。

继续探索和开发更加高效的算法,借此改进不同传感器数据之间的融合方式。比如,采用图网络针对不同模态进行匹配,而且尤其要关注在处理高动态和复杂环境下的交通场景。

其次,要增强驾驶员的注意力模型。

即进一步地研究驾驶员注意力的模拟机制,探索如何更加精确地预测和模拟人类驾驶员的注意焦点,以及探究这些焦点对于驾驶决策的影响。

再次,要开展安全性和鲁棒性的验证。

即将现有模型部署到物理世界的小车中,通过更多的物理实验,验证模型在真实世界条件下的性能。

从而将研究扩展到恶劣天气、夜间驾驶等更广泛、更多样的驾驶场景和环境条件之中,借此验证和提高系统的通用性和适应性。

最后,要开展人机交互的研究。

即探索如何将这一技术与人机交互更紧密地结合,例如通过提供给驾驶员更直观的风险警告和辅助决策支持,增强自动驾驶车辆与人类驾驶员之间的互动。

通过这些后续研究计划,徐冬阳希望不仅可以提升自动驾驶技术的性能,也能确保其更加贴近人类驾驶行为的理解,为实现更安全、更智能的自动驾驶技术打下基础。

参考资料:

1.https://arxiv.org/pdf/2403.12552.pdf

运营/排版:何晨龙

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-11 11:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

解密大脑中的隐形导航系统,人类自我如何构建虚拟世界
... 自托尔曼的研究以来,心理地图的研究领域不断扩展。科学家们通过各种实验,逐步揭示了大脑是如何形成和使用这些认知地图的。例如,研究发现海马体在空间记忆和导航中起到了关键作用。
2024-06-18 13:52:00
浙大校友自研跨模态模型,打造具身智能的“通用语法”
...展开图式。”巧合的是,也正是在这一时期,英国计算机科学家阿兰·图灵(Alan Turing)在论文《计算机器与智能》(Computing Machinery and Intelligence)中
2024-03-22 10:31:00
...值得未来探索。论文作者之一、上海人工智能实验室青年科学家李弘扬博士表示,UniAD提供了全套关键自动驾驶任务配置,其充分的可解释性、安全性、与多模块的可持续迭代性,是目前为止
2023-06-25 08:52:00
什么是AGI?人工智能的未来
...统可以被用来取代人类大脑,从组织和管理矿山或工厂到驾驶飞机、分析情报数据或规划战斗等各种任务。Mark Gubrud认为【AGI】可以取代人类的大脑,做方方面面的领域应用,如
2024-03-19 06:00:00
作者 | 周永亮编辑 | 靖宇自动驾驶的进程,因为大模型又起波澜。近几年,自动驾驶近年发展迅猛,硬件预埋软件持续迭代的风潮下,车载算力急剧增长快速普及,但软件端功能进化滞后于算力
2023-06-16 16:48:00
毫末智行:自动驾驶行业中的龙头
...来一个前所未有的创新高潮,而在这场科技革命中,智能驾驶无疑是最具潜力和影响力的领域之一。在过去的数年里,伴随着计算机视觉、机器学习、传感器技术的发展,智能驾驶技术已经取得了显
2023-10-15 01:50:00
智能“传感”,“感知”天下(科技名家笔谈)
...产力发展,人类越来越需要全方位地感知世界。1821年,科学家利用材料因温差产生电压的原理,研制出世界上第一个传感器——温度传感器。最初,人们直接利用光、热、电、力、磁等物理效
2024-01-29 03:46:00
对话商汤王晓刚:自动驾驶借助强化学习将超越人类,今年商业化迎爆发
...深度对话,本期我们邀请到商汤科技联合创始人&首席科学家、商汤绝影CEO王晓刚。出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“今年会是加速发展年,市场将迎来爆发。”
2025-02-27 11:36:00
从“智能涌现”到“超人类”,通往AGI巅峰的终极设想
...ind联合创始人谢恩·莱格(Shane Legg)将AGI的概念向计算机科学家们普及时[9],他将AGI定义为在认知任务上能取得类人表现的机器智能
2023-12-01 09:21:00
更多关于科技的资讯:
职场福尔摩斯速成手册:5个细节看穿谁是“真领导”
茶水间摸鱼时偷听到两个实习生争论:“新来的总监开会总爱说‘我觉得’,一看就没领导力!”“你懂啥,人家之前带团队拿过行业大奖
2025-04-02 09:00:00
Mistral AI 米斯特拉尔 的AI+金融,打造全球最精准的智能投顾系统
AI在金融领域的应用正迎来革命性突破,而MistralAI米斯特拉尔站在这一浪潮的最前沿。公司最新推出的AI+金融解决方案
2025-04-02 09:16:00
嘉兴卓威科技:以创新智造赋能健康未来,远红外治疗仪获双证认证
近日,嘉兴卓威科技有限公司(以下简称“卓威科技”)自主研发的“接触式远红外治疗仪”正式通过浙江省药品监督管理局医疗注册证及生产许可证双认证
2025-04-02 09:16:00
在国家大力推进新型城镇化建设和建筑业转型升级的大背景下,建筑工程领域正迎来前所未有的发展机遇。随着城市基础设施建设的不断推进和建筑技术的日新月异
2025-04-02 09:16:00
爱凯奇品牌郑朝君匠心铸就中国轻工业新标杆‌
导语‌2025年3月,中国轻工业领域迎来高光时刻——爱凯奇品牌携其创始人郑朝君先生的创业故事与品牌理念,强势登陆央视综合频道(CCTV-1)爱凯奇央视广告播出ID号(2510595470050021)
2025-04-02 09:17:00
链动济宁①|以链式突围制胜,济宁工程机械千亿舰队加速驶向全球
齐鲁晚报·齐鲁壹点 孔茜中国工程机械行业春潮涌动。中国工程机械工业协会最新数据显示,2025年2月国内挖掘机销量达19270台
2025-04-02 09:25:00
本文转自:人民网-青海频道况玉人民网记者:南京智算中心在全国处于怎样的地位?青海移动算力分公司市场拓展部经理江恺瑞:南京智能计算中心是全国首批9家建设的国家新一代人工智能公共算力开放创新平台之一
2025-04-02 09:39:00
创想三维11周年店庆,3D打印机享国补+百亿补贴,惊喜上线
今年4月9日,创想三维即将迎来成立11周年的里程碑。作为全球消费级3D打印生态领创者,创想三维以先进技术与卓越品质,赢得全球500万创客用户青睐
2025-04-02 09:45:00
DeepSeek预测中大型企业招聘优先挑选AI招聘系统!
在数字化转型浪潮席卷全球的当下,人工智能(AI)正以前所未有的速度重塑企业运营的每一个环节。近日,知名行业研究机构DeepSeek发布《2024企业招聘技术趋势报告》
2025-04-02 09:45:00
2025中关村论坛年会:人工智能引领科技变革与产业升级
3月27日至31日,由科技部、国家发展改革委、国务院国资委、中国科学院、中国工程院、中国科协和北京市政府共同主办的2025中关村论坛年会在京举行
2025-04-02 09:45:00
中微公司等离子体刻蚀技术再获重大突破,引领行业迈向新高度
近日,中微半导体设备(上海)股份有限公司(股票代码:688012.SH,以下简称“中微公司”)传出振奋人心的消息。通过持续提升反应台之间气体控制精度
2025-04-02 09:51:00
蚂蚁消金被罚140万,合规警钟为谁而鸣?
文|罗曾日前,国家金融监督管理总局重庆监管局的一纸罚单,将重庆蚂蚁消费金融有限公司(下称“蚂蚁消金”)推至风口浪尖。这家成立不足四年的消费金融巨头
2025-04-02 09:52:00
首届中国手机摄影大展正式启动
本文转自:人民网首届中国手机摄影大展系列活动在四川省巴中市正式启动。作为首个国家级手机摄影品牌活动,本届手机摄影大展以“人人都是创作者”为主题
2025-04-02 10:11:00
数智赋能开启中小微商户运营新篇章
鲁网4月1日讯(记者 郑泽之 通讯员 张沙沙)在数字经济浪潮下,中小微商户的生存与发展正经历深刻变革。随着5G、云计算
2025-04-02 10:11:00
古贝春百年老窖金装酒荣膺2024年度“青酌奖”酒类新品
鲁网4月1日讯(记者 吴美琳)3月28日,在四川泸州举办的第二十二届中国国际酒业博览会上,中国酒业协会正式揭晓2024年度“青酌奖”酒类新品评选结果
2025-04-02 10:12:00