我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果

类别：科技发布时间：2024-10-30 09:54:00 来源：机器之心Pro

近日，极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D，是首个利用世界模型增强 4D 驾驶场景重建效果的工作。DriveDreamer4D 可以大幅提升多种自动驾驶 4D 重建算法的效果，在 user study 实验中获得了超过 80% 的偏好投票，为走向空间智能和 4D 世界模型迈出了坚实的一步。

论文链接：https://arxiv.org/abs/2410.13571 项目主页：https://drivedreamer4d.github.io/ 代码地址：https://github.com/GigaAI-research/DriveDreamer4D

闭环仿真技术是推动端到端自动驾驶系统发展的关键。目前的传感器仿真方法，如 NeRF 与 3DGS，主要依赖于训练数据分布，若训练数据不足，则这些方法在复杂驾驶操作（例如变道、加速或减速）的重建效果不佳。近来，自动驾驶世界模型（World Model）证明其可以生成丰富驾驶数据。在此背景下，本文提出了 DriveDreamer4D，是首个利用世界模型来提升自动驾驶场景 4D 重建质量的算法。

DriveDreamer4D 可以为驾驶场景提供丰富多样的视角（包括变道、加速和减速等）数据，以增加动态驾驶场景下的闭环仿真能力。

DriveDreamer4D 利用世界模型作为数据引擎，基于真实世界的驾驶数据合成新轨迹视频（例如变道场景）。如下图所示，DriveDreamer4D 不仅可以提升多种重建算法（PVG,S3Gaussian,Deformable-GS）的图像渲染质量，还可以提升驾驶前景（车辆）和背景（车道线）的时空一致性。

DriveDreamer4D 的总体结构框图如下所示，轨迹生成模块（NTGM）用于调整原始轨迹动作，如转向角度和速度，以生成新的轨迹。这些新轨迹为提取结构化信息（如车辆 3D 框和背景车道线细节）提供了全新的视角。随后，基于世界模型的视频生成能力，并利用更新轨迹后得到的结构化信息作为控制条件，可以合成新轨迹的视频。最后，原始轨迹视频与新轨迹视频相结合，进行 4DGS 模型的优化。

在实验中，多种传统算法（PVG, S3Gaussian,Deformable-GS ）在变道场景下的车道线、天空、车辆都会模糊，甚至出现 “鬼影” 现象。而 DriveDreamer4D 可以提升多种重建算法在复杂变道场景下的视频渲染效果，不仅消除了 “鬼影”，而且提升了交通元素的渲染质量，车辆和车道线都更加清晰。

视频链接：https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

除了变道，在车辆变速场景下，传统算法（PVG,S3Gaussian,Deformable-GS）的表现能力也受到限制，如下第一列视频所示，这些算法在自车加速时，前方的车辆都出现了 “拖影” 现象。而经过 DriveDreamer4D 提升后，渲染的车辆的时空一致性更高。

视频链接：https://mp.weixin.qq.com/s/PYh6khHqZqi2PMKKSpf3Ew

在定量实验中，本文证明了 DriveDreamer4D 不仅可以提升多种重建算法 (PVG, S3Gaussian,Deformable-GS）的图像渲染质量 (如表 2)，还可以提升车辆和车道线渲染的时空一致性（如表 1）。此外，本文还通过 user study（表 3）证明用户更加偏好 DriveDreamer4D 的渲染效果，获得了超过 80% 的投票率。

表 1 DriveDreamer4D 提升了车辆和车道线重建渲染的时空一致性

表 2 DriveDreamer4D 提升了图像重建渲染质量

表 3 User study 证明用户更加偏好 DriveDreamer4D 的渲染效果

本项 DriveDreamer4D 工作是极佳科技研究团队之前 DriveDreamer 和 DriveDreamer-2 工作的延续。

DriveDreamer 是首个面向真实驾驶场景的世界模型，可以根据不同的控制条件生成自动驾驶周视视频，有效提升了 BEV 感知的性能；DriveDreamer-2 在此基础上，引入大语言模型，可以生成用户自定义的驾驶数据，进一步提升了长尾和 corner case 场景下的数据生成能力。针对端到端自动驾驶和闭环仿真对于场景重建的迫切需求，DriveDreamer4D 利用 DriveDreamer 系列工作的能力，用以生成新轨迹视频（例如变道、加减速），从而大幅提升了多种 4DGS 算法的重建效果。

本篇论文的牵头完成单位为极佳科技，是一家空间智能公司，致力于将视频生成提升到 4D 世界模型，赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力，实现 4D 空间中的交互和行动，走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作，以及自动驾驶、具身智能等物理空间的数据生成和认知推理能力，都有巨大的价值和作用。极佳科技是国内最早开始探索和布局世界模型和空间智能方向的公司，在物理空间和虚拟空间两方面都已取得显著的技术和商业进展，获得了行业广泛的认可。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-10-30 11:45:10

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于模型,世界,驾驶,场景,突破,效果的资讯：

革命性技术突破引发热议人工智能应用前景广阔

...家论坛第十九届夏季高峰会上，与会嘉宾热议人工智能大模型。机器深度学习的革命GPT是一种先进的自然语言处理模型，通过预训练可以适应各种任务，以实现更高的语言理解和生成能力。36

2023-09-14 17:08:00

AI视频生成能操控运镜了！轻松推拉升降，秒拍电影大片，Run

...11月1日，美国明星AI视频生成创企Runway为其Gen-3 Alpha Turbo模型推出了新的AI相机控制功能

2024-11-08 09:47:00

对话元戎启行周光：“车位到车位”的智驾，依靠的是高精地图，是

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦“大模型经历了从专家系统到通才系统，再到真正强专家系统的阶段，智驾、机器人也会经历同样阶段。”这是元戎启行CEO周光对物理AI发展

2025-04-02 11:29:00

对话商汤王晓刚：自动驾驶借助强化学习将超越人类，今年商业化迎

...去两年，自动驾驶厂商和车企，都在追求基于端到端的大模型，使得自动驾驶的能力持续突破。不过，王晓刚表示，这种端到端路线也有局限，非常依赖数据，且本质仍是模仿学习，很难突破人类驾

2025-02-27 11:36:00

华为、特斯拉带头车企卷入“大模型”军备竞赛

作者 | 周永亮编辑 | 靖宇自动驾驶的进程，因为大模型又起波澜。近几年，自动驾驶近年发展迅猛，硬件预埋软件持续迭代的风潮下，车载算力急剧增长快速普及，但软件端功能进化滞后于算力

2023-06-16 16:48:00

拓展AI大模型能力边界，蘑菇车联获评“2024年中国独角兽企

...)独角兽企业大会在深圳举行。蘑菇车联(MOGOX)凭借在AI大模型与自动驾驶领域的突破性技术创新及规模化应用成果，入选“2024年GEI中国独角兽企业”

2025-07-18 20:30:00

商汤日日新大模型体系更迭升级，金融、医疗等行业场景落地已超2

今年6月拍摄的商汤大模型产品商量SenseChat界面（来源：钛媒体App编辑拍摄）时隔仅3个月，商汤“日日新”AI大模型正式更新

2023-07-11 13:00:00

文生视频让自动驾驶看到新方向

...工智能在AI技术应用中成为焦点，尤其是文本生成视频大模型Sora，近来更是在全球范围内激发了科技创新的热潮。香港科技大学（广州）人工智能学领域助理教授兼博士生导师陈颖聪教授，

2024-03-14 05:26:00

人工智能应用场景不断拓展

...近日，2024云栖大会在浙江杭州举行，一系列人工智能大模型的新成果、新应用集中亮相——人工智能应用场景不断拓展本报记者刘峣《人民日报海外版》（ 2024年09月26日

2024-09-26 04:44:00

更多关于科技的资讯：

“数”智金融・龙泉“量”剑中州龙泉期货数智平台3.0重磅发

在数字经济深度赋能资本市场的时代浪潮中，为积极响应证监会金融“五篇大文章”战略部署，2025年11月7日，“数”智金融・龙泉“量”剑——中州龙泉期货数智平台3

2025-11-12 12:56:00

梅特勒托利多 2025 进博会首秀圆满落幕，国产化成果引多方

为期六天的 2025 年中国国际进口博览会正式落下帷幕，全球精密仪器领军者梅特勒托利多首次参展便交出亮眼答卷。作为受临港政府邀请的重点企业

2025-11-12 12:56:00

高途公考2026年线上事业单位产品发布会盛大召开！

2026年11月5日，高途公考以“豫见高途，事启新程”为主题，召开线上事业单位产品发布会。在就业市场从“学历提升”向“稳定就业”转型的背景下

2025-11-12 12:54:00

中亦科技入选北京市“诚信兴商”倡议企业

近日，由北京市商务局主办的2025年“诚信兴商”北京主题日活动暨第十四届北京企业诚信论坛在京隆重举行。本次活动旨在弘扬诚信经营理念

2025-11-12 11:45:00

京东集团南京研发中心正式落户建邺

南报网讯（记者卫凌云通讯员建萱）11月11日，京东集团成功竞得NO.宁2025Y05地块，京东集团南京研发中心正式落户建邺

2025-11-12 08:05:00

“撬来”融资近百亿，“撬动”科创新未来

南报网讯（记者张安琪）11月11日下午，2025年“江苏省成果（专利）拍卖季”软件与信息服务产业专场活动在江宁开发区大数据中心举办

2025-11-12 08:06:00

红山路商业综合体打造“年轻力”潮流集中地

11月10日，红山路红山Sparkle耀市开启试运行，首批餐饮店、发廊、健身房等已开业。该项目为铁北红山国际社区商业部分

2025-11-12 08:06:00

J2国际牵手DeepX G20：一款真正在做性价比的算力设备

2025年11月，“我在IT分销领域深耕三十多年，从诺基亚时代、摩托罗拉、苹果手机到笔记本、算力服务器，见过无数款软硬件产品

2025-11-11 14:38:00

同舟致远•共赢新程泰凯英上市启航仪式在青岛隆重举行

11月7日，青岛泰凯英专用轮胎股份有限公司在青岛市崂山区成功举行"同舟致远•共赢新程"上市启航仪式。崂山区政府、青岛市上市公司协会

2025-11-11 14:49:00

旅美博士青年钢琴家周海天：在理性与证据中寻找音乐之美

近年来，越来越多青年钢琴赛事在亚洲和北美活跃展开，一批具有国际视野与学术背景的青年评委逐渐走入公众视野。一位拥有中、英

2025-11-11 14:49:00

在中国，为中国 Brother第八届进博会迎收官，多元打印服

11月10日，第八届中国国际进口博览会（以下简称"进博会"）即将盛大落幕。全球知名制造厂商Brother以"In China

2025-11-11 15:20:00

Hape坚守对全球消费者承诺，积极布局供应链保障产品质量与供

在接受《福布斯》（Forbes）杂志采访时，Hape集团创始人兼总裁Peter Handstein先生表示，目前整个玩具行业正经历一场"过山车"般的考验

2025-11-11 15:20:00

临沂，何以再造一个新商城？

鲁网11月11日讯（记者杨成喜通讯员胡一帆于萍）从上世纪八十年代初的小地摊开始算起，临沂的商贸生意已经走过了四十余年

2025-11-11 15:48:00

喜良观经济｜第17个年头的“双11”，看看吉林人最爱买啥？

当“双11”进入第17个年头，“销售额”早已不再是外界关注的重点。与其相比，这一节点现已成为窥见未来中国电商行业发展方向的一扇窗

2025-11-11 15:57:00

2025网聚美好安徽｜池州：“芯”产业闯出新天地

大皖新闻讯在高质量发展的时代画卷中，产业集群化已成为区域经济竞争的重要赛道。11月11日，2025网聚美好安徽网络主题活动采访团来到池州市

2025-11-11 16:17:00

头条订阅服务

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果