• 我的订阅
  • 科技

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

类别:科技 发布时间:2024-11-09 09:54:00 来源:机器之心Pro

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。

来自中科院自动化所的团队提出 FreeVS,一个全生成式的新视角合成方法。相较于仅能在记录的车辆行驶原轨迹上渲染高质量相机视角的基于场景重建的方法,FreeVS 能够作为生成引擎渲染真实场景中任意车辆行驶轨迹下的视频。FreeVS 可被直接部署于任何测试场景,而无需负担通常耗时 2-3 小时的场景重建过程。

新轨迹下相机视频

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

论文链接:https://arxiv.org/abs/2410.18079 项目主页:https://freevs24.github.io/

以生成模型合成真实场景中的相机成像

现有驾驶场景中的新视角合成方法多遵循「场景重建 - 新视角渲染」的管线,依靠重建得到的 NeRF 或 3D-GS 等场景表示来渲染新视角下的成像。

然而基于重建的方法具有两大瓶颈,1)无法合理渲染缺少对应观测的新视角上的图像,2)场景重建耗时长;这使得重建方法无法高效高质地在实际数据采集轨迹之外渲染大量新相机视图。

如简单的视角左右平移即会引起前有方法图像渲染质量的严重下降:

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

与前有重建方法在原训练视角、训练视角右一米、训练视角上一米的视角合成效果对比。

对此,作者提出一种新颖的完全基于生成模型的新视角合成方法 FreeVS。作者采用一简洁有效的生成管线,可严格基于已观测到的三维场景生成任意视角的相机观测,且无需进行场景重建。

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

FreeVS 方法管线。生成模型基于染色点云投影恢复相机成像。

作者采用从稀疏点云投影中恢复相机成像的生成管线,这使得生成模型的行为类似于 Inpainting 模型,基于稀疏但可靠的点云投影点补全目标图像。

在训练过程中,生成模型学习基于给定帧的三维先验生成邻近帧的相机成像。尽管训练数据中驾驶车辆在绝大多情况下走直线前行,但生成模型可沿车辆轨迹在侧向相机视角学习相机视角的横向移动。

在测试阶段,以图像信息染色的场景三维点云被投影至任意所需视角,以控制图像生成结果。

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

FreeVS 方法训练数据与推理效果示例。即使训练数据中无车辆横向移动到逆行车道的例子,生成模型仍然可依靠侧向相机的训练对((c)->(a))学习相机的侧向移动,从而生成合理的高质量成像 (f)。

车辆行驶模拟与场景编辑

以 Waymo 数据集中的真实场景为例,FreeVS 能够在驾驶车辆原本并未移动的场景模拟车辆移动:

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

能模拟车辆变线行驶,甚至能秒变 GTA,使车辆撞向行人:

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

真实视频

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

新轨迹下相机视频

能在原本直行的场景令车辆走大 Z 型前进:

真实视频

新轨迹下相机视频

也能对场景内容进行编辑。任意替换场景车辆,或定制车辆运动。

场景编辑后相机视频

与前有基于重建的方法比较,FreeVS 在新车辆运动轨迹下几乎不受图像模糊、伪影等现象困扰。

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650942315&idx=2&sn=3af0225330fa22b489fb78f578e46b9a&chksm=84e7ef15b390660382de90780b87727e06b2ede0910a812c45952a52eb641a41046682a543a3&token=1462704460&lang=zh_CN#rd

FreeVS 与前有方法在新轨迹模拟的表现对比。

新相机模拟

除新行驶轨迹下视角合成,FreeVS 还能合成虚拟相机位置上的成像。而前有基于重建的方法难以应对虚拟相机位置上全部观测的缺失。

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

新相机模拟示意图

把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了

FreeVS 与前有方法在新相机模拟的表现对比。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-09 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...更精确、更多用途的目标控制。目前的方法通常使用二维轨迹来表示目标对象的空间运动,这种方法往往无法捕捉用户的意图,而且经常产生不自然的结果。 为了增强控制效果,南洋理工大学研
2024-12-13 09:19:00
首个3d人像视频生成模型来了
只需1张普通照片,就能合成全角度动态3D视频。眨个眼、动动嘴,都是小case~最近AIGC爆火,3D人像模型生成这边也没闲着
2023-02-22 19:23:00
女子车中财物被盗,江岸警方历时10天抓获嫌疑人并追回财物
...快速离开。 民警吴畅、周炜鹏立即视频追踪该男子行动轨迹,经过10余小时不间断查看视频,于11月26日最终确定了嫌疑人余某的身份信息和活动范围。经过一周实地盘查蹲守,确定了嫌
2023-12-08 16:26:00
旭化成微电子新横滨半导体技术研发中心成立
...讯的ICC,在没有引擎的EV中也能感受模拟引擎声的引擎声合成器。※AKM是旭化成微电子株式会社英文名AsahiKaseiMicrodevicesCorporation的缩写
2024-09-10 13:54:00
FANNTA二单上线:坠入经典粤语歌曲时空,延绵入梦
...-VERSE多重宇宙》之中,那清脆的鼓点、轻薄却不失律动的合成器与吉他哇音,以及层层包裹的和声,无不将人瞬间带回上世纪70-80s’的Motown时代
2023-09-05 22:31:00
VEGAS Pro 19中文版下载_VEGAS Pro(视频编辑)直装版-vegas pro 19中文破解版
Vegas Pro是一个视频剪辑工具,我们可以使用这个软件来制作各种奇幻的视频。因为我们可以在里面添加各种特效和转场,让你的视频看起来更有观赏性。支持自由建立图层,在图层中添加素
2023-01-25 11:00:00
...则是OST(光学透视)技术,它可以让用户透过半透明光学合成器看到真实世界,也能看到计算机生成的图像。虽然都能实现“虚实融合”,但VST和OST技术各有优势和短板。目前,VST
2024-01-12 06:04:00
大势日本女子组合XG 发布新单曲MV
...的方向并迈向另一个维度的决心。《LEFTRIGHT》具有重复的合成器循环和带有嘻哈/R&B氛围的Trap节拍
2023-02-13 23:00:00
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...控制,并生成高保真度、一致性强的新视角视频。△相机轨迹规划算法此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代
2024-09-19 13:37:00
更多关于科技的资讯: