我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

单图解锁全景视角！北大/港中文/腾讯等推出ViewCrafter | 已开源

类别：科技发布时间：2024-09-19 13:37:00 来源：量子位

随便给张图就能从更多视角查看全景了？！

话不多说，先看一波效果，单视角输入be like：

难度升级，接下来换成双视角，看起来衔接也非常丝滑。

以上来自ViewCrafter，由北大、港中文、腾讯等机构的研究人员提出，可以从单张或稀疏输入图像生成精确相机可控的新视角视频。

还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。

目前论文和代码均已开源，并提供了在线Huggingface demo供用户使用。

ViewCrafter：一种新视角生成方法

传统的新视角生成方法，如NeRF和3D-GS等技术，存在一个痛点：

依赖于密集的多视角训练数据

这限制了它们在仅有稀疏（输入图像数量有限，不能提供完整视角或详尽场景信息）甚至单张输入视角的情况下的应用。

同时，传统方法对训练资源的需求较高，且不具备泛化能力，这限制了它们在训练资源受限场景下的应用。

因此，ViewCrafter最终想实现：

从稀疏视角图像甚至单张输入图像中生成任意规模场景的新视角。

这需要模型对3D物理世界有全面的理解。

接下来一起康康具体咋实现的。

概括而言，ViewCrafter是基于点云先验的可控视角视频生成。

首先，快速多视图/单视图stereo技术的发展，使得从单张或稀疏图像中快速重建点云表征成为可能。

点云表征能够提供3D场景的粗略信息，支持精确的相机位置控制以实现自由视角渲染。

然而，由于点云的表示能力较弱，加之极其稀疏的输入图像只能提供有限的3D线索，重建出的点云存在大面积的遮挡和缺失区域，并可能面临几何形变和点云噪声。

这些问题限制了其在新视角合成上的应用。

与此同时，在大规模视频数据集上训练的视频扩散模型能够深入理解3D物理世界，支持从单张图像或文本提示中生成符合物理规律和现实世界规则的视频内容。

然而，现有的视频扩散模型缺乏显式的场景3D信息，因此在视频生成过程中难以实现精确的相机视角控制。

针对这些优缺点，团队提出将视频扩散模型的生成能力与点云表征提供的显式3D先验相结合，以实现相机精准可控的任意场景高保真度新视角视频生成。

具体而言，给定单张或稀疏视角输入图像，团队首先使用快速多视图stereo方法构建其点云表征，以实现精准地移动相机进行自由视角渲染。

随后，为了解决点云渲染结果中存在的大面积缺失区域、几何失真和点云伪影，团队训练了一个以点云渲染结果为控制信号的视频扩散模型作为增强渲染器。

这一渲染器能在粗糙的点云渲染结果的基础上进一步生成具有高保真度和3D一致性的新视角。

通过结合点云提供的显式3D信息以及视频扩散模型的强大生成能力，新方法能够在视频生成过程中实现6自由度的精准相机位姿控制，并生成高保真度、一致性强的新视角视频。

△相机轨迹规划算法

此外，现有的视频扩散模型难以生成长视频，因为长视频推理会造成巨大的计算开销。

为了解决这一问题，研究采用了一种迭代式的新视角生成策略，并提出了一种内容自适应的像机轨迹规划算法，以逐步扩展新视角覆盖的区域和重建的点云。

具体来说，从初始输入图像构建的点云开始，团队首先利用相机轨迹规划算法，从当前点云预测一段相机轨迹，以有效揭示遮挡和确实区域。

接着，团队根据预测的轨迹渲染点云，并利用ViewCrafter根据渲染的点云生成高质量的新视角。

随后利用生成的新视角更新点云，以扩展全局点云表征。

通过迭代执行这些步骤，最终可以获得覆盖大视场范围和扩展点云的高保真新视图，并支持高斯重建等下游任务。

具体应用上，基于ViewCrafter和提出的迭代式新视角生成算法，可以从单张图像/稀疏视角甚至一段文字描述中进行3D高斯重建，以支持实时渲染和沉浸式3D体验。

对比实验

团队从多个角度对比了新方法。

从新视角生成来看，团队在Tanks-and-Temples，CO3D， RealEstate10K这三个真实世界数据集上与SOTA方法进行了定量和定性比较。

实验结果证明，ViewCrafter在相机位姿控制的精准程度，以及生成新视角的视觉质量上都优于对比方法。

在场景重建方面，团队在Tanks-and-Temples数据集上与稀疏视角重建领域的SOTA方法进行了定量和定性比较。

结果证明，ViewCrafter在3D高斯重建渲染出的新视角的视觉质量上也超过了对比方法。

文生3D结果如下。左边显示了文本提示以及文生图效果，后面是最终的3D效果。

当然，团队也进行了消融实验。

比如利用点云先验作为视频扩散模型控制信号的有效性。

具体而言，一些同期工作采用普吕克坐标作为视频生成模型的控制信号，以实现相机可控的新视角生成。

作为对比，为了验证点云控制信号的优越性，团队训练了一个以普吕克坐标为控制信号的新视角生成模型，并进行控制变量实验，保证除了控制信号外其他模型结构与ViewCrafter一致。

两个模型在新视角生成任务上对比结果如下所示：

实验结果证明，不管是在新视角生成质量还是在相机控制的精准程度上，团队使用的基于点云的控制信号都要优于基于普吕克坐标的控制信号。

另外，团队验证了模型对粗糙点云的鲁棒性。

如图所示，对于作为控制信号的点云具有严重几何形变的情况，模型依然能够有效地进行几何纠错和空洞修补。

这证明了新方法对点云控制信号的鲁棒性。

概括下来，团队验证了ViewCrafter对于静态场景的强大新视角生成能力。

接下来，团队计划探索和单目视频深度估计方法结合，实现单目动态视频的新视角生成和4D重建。

更多细节欢迎查阅原论文。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-09-19 15:45:02

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于全景,腾讯,中文,视角,北大,视角的资讯：

国家林草局与腾讯战略合作，多媒体实验室助力推出首个12.5亿

...原局与腾讯公司联合推出了首个中国国家公园12.5亿像素VR全景APP。用户可在手机端120倍放大，全景“云”游东北虎豹国家公园。技术团队深入东北虎豹国家公园无人区，通过智能影

2023-05-10 21:00:00

获众多资本青睐！这家视觉算法提供商在青启动上市辅导

...视觉算法在不同行业场景的开发与应用，其管理团队来自腾讯、微软、北京大学、杜克大学、香港中文大学、浙江大学等顶尖企业及实验室。目前公司开创的AI商城已上架1200余种算法，覆盖

2024-01-08 09:53:00

没看过《三体》，可以先看它

...别人的答案。“科幻小说，最大的特点是思想实验。”在腾讯视频随剧推出的知识解读节目《解码三体》中，许多专家、学者以“对谈”的形式，发表了他们对于《三体》的观点。节目中，科幻作家

2023-01-19 19:39:00

腾讯3D大模型全面开源，文本图像10秒转3D资产

...字、图像转3D的模型来了，效果还是SOTA级别。就在刚刚，腾讯宣布推出Hunyuan3D-1.0，一口气开源轻量版和标准版两个模型

2024-11-06 09:43:00

《公诉》首播收视夺冠

...型，用极具悬疑推理感的故事架构和年轻化的叙事方式，全景展示了新时代公诉人的职业风采以及新时代政法干警的精神风貌。值得一提的是，和以往大多数由男性演员为主要视角的检察剧、悬疑题

2023-05-31 02:35:00

电视剧《长安的荔枝》开播全景展现唐代五千里荔枝转运传奇

由曹盾执导、马伯庸担任原著及故事顾问，雷佳音领衔主演、岳云鹏领衔主演，中央广播电视总台、中国电视剧制作中心、腾讯视频、留白影视、浙文影业联合出品，留白影视承制，棉锦文化联合承制的

2025-06-09 09:17:00

展现1931年长江洪水史的多重视角

...由华洋义赈会捐给了江苏省政府。当然了，考虑到本书是全景式的鸿篇巨制，虽有此小疵，亦瑕不掩瑜。

2023-11-27 18:09:00

电视剧《夏花》亮相腾讯视频，以女性视角诠释当代爱情观

本文转自：人民日报客户端曹玲娟由上海腾讯企鹅影视文化传播有限公司等出品的《夏花》，2月13日在腾讯视频播出。剧集改编自小说《他站在夏花绚烂里》，由言承旭、徐若晗领衔主演，以独特笔

2023-02-14 11:05:00

美丽浩瀚、广袤无垠空间站视角记录祖国大美河山全景图

...期待飞船绕飞过程中拍摄的以地球为背景的空间站组合体全景图像。在此之前，我们先来一起欣赏航天员们此前从太空视角为我们记录的祖国大美河山。首先看到的是“神十六”乘组从中国空间站舷

2023-10-31 16:11:00

更多关于科技的资讯：

数字化转型背景下企业行政管理效率提升路径研究

摘要：本文聚焦数字化转型背景下企业行政管理效率提升问题，首先剖析数字化转型与企业行政管理的内在关联，指出二者通过流程优化

2025-11-15 05:22:00

2025网聚美好安徽｜“双路由”直连上海看宿州腾“云”而上

大皖新闻讯 11月14日，“皖美十四五再启新征程”2025网聚美好安徽网络主题活动采访团走进位于宿州高新区的汴水之畔超级计算中心

2025-11-15 10:05:00

“世界舞台”上秀一圈，南京收获了什么？

进博会圆满落幕，南京交易分团意向成交9.98亿美元“世界舞台”上秀一圈，南京收获了什么？□南京日报/紫金山新闻记者黄琳燕11月10日

2025-11-14 08:38:00

埃斯顿工业机器人出货量持续增长宁企连续三季霸榜国内“一哥”

11月13日，在江宁开发区埃斯顿智能制造示范车间内，工业机器人正在做各种场景应用展示。宁企埃斯顿今年前三季度机器人总销量约25000台

2025-11-14 08:39:00

一批创新产品亮相“宁创新品”信创产业教育专场活动

一批创新产品亮相“宁创新品”信创产业教育专场活动只需3步，20分钟完成全班作业批改南报网讯（记者徐宁）上传空白试卷和答案

2025-11-14 08:39:00

以AI引擎打造数字化转型山西模式

图片由讲述人提供讲述人山西数据流量谷副总经理邵同旭我是山西数据流量谷的邵同旭，长期专注于数据要素与人工智能领域。多年来

2025-11-14 08:52:00

张家口农商银行宣泰支行年末服务提质增效

岁末是金融服务的“大考期”，业务量激增、客户需求多元叠加。张家口农商银行宣泰支行聚焦柜面运营核心环节，以“压降投诉、提升质量

2025-11-14 10:07:00

情绪消费流行，要做好服务和引导

秋实如今，快节奏的都市生活中，“情绪消费”成为一种新的消费方式。数据显示，超九成青年认可情绪价值，近六成青年愿意为情绪价值买单

2025-11-14 11:28:00

一杯咖啡里的中国大市场

新华社记者王雨萧周蕊一杯咖啡，能勾勒出怎样的经济图景？从云南绵延百万余亩的咖啡种植园，到上海梧桐树下香气氤氲的创意特调

2025-11-14 11:28:00

“信息茧房”效应是怎样破解的？

惠依近日，深圳大学深圳城市传播创新研究中心发布《短视频用户的算法实践与“破茧”报告》。《报告》显示，与一些人担忧“信息茧房”形成对比

2025-11-14 11:28:00

如新荣获2025消费责任对话活动客户服务创新典型案例

2025年11月5日，以“大力提振消费品质服务担当”为主题的消费责任对话活动在成都成功举办。本次活动由中国消费者协会

2025-11-14 11:29:00

Shopee 11.11大促热力爆棚，Shopee Live

2025年11月13日，中国 —— 近日，东南亚及巴西领航电商平台Shopee 11.11大促再掀购物狂潮，Shopee Live直播开场4分钟即售出1100万件商品

2025-11-14 11:31:00

风暴来袭！先优食品推出以“樱花炸鸡“为核心的四大天王系列炸鸡

当颜值经济邂逅味觉升级，以创新研发与品质制造为核心优势的青岛先优食品有限公司，重磅推出以“樱花炸鸡“为核心的四大天王系列炸鸡战略级产品

2025-11-14 11:32:00

招商创科携手凯赛生物推动生物基材料应用助力纺织产业绿色升级

在科技创新成为国家发展战略核心的背景下，招商局集团积极推进“第三次创业”，通过旗下招商创科、招商积余到家汇平台，联合生物制造企业凯赛生物

2025-11-14 11:32:00

佳人与银都拉玛集团成立合资公司共推全球纺织行业循环发展

曼谷（泰国）/浙江（中国）——2025年11月11日——全球领先的再生聚酯纤维、纱线及技术纺织品供应商银都拉玛集团（Indorama Ventures）纤维业务部

2025-11-14 11:32:00

头条订阅服务

单图解锁全景视角！北大/港中文/腾讯等推出ViewCrafter | 已开源