我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

首个3d人像视频生成模型来了

类别：科技发布时间：2023-02-22 19:23:00 来源：浅语科技

只需1张普通照片，就能合成全角度动态3D视频。

眨个眼、动动嘴，都是小case~

最近AIGC爆火，3D人像模型生成这边也没闲着。

如StyleNerf、StyleSDF、EG3D等方法相继出世。

但到目前为止，这种生成模型都还停留在单帧人像上。

最近，来自新加坡国立大学（NUS）和字节跳动的研究人员，在静态3D模型的基础上，提出了首个3D人像视频生成模型：PV3D（3DmodelforPortraitVideogeneration）。

PV3D的训练继承了3DGAN模型的优点，即无需动态的三维数据监督，只需要在足够数量的单视角2D视频数据上进行训练。

该生成框架将人像和动作进行解耦，基于视频的时间戳生成各自的三维表征，让视频可以从任意角度进行渲染。

长视频也能挑战：

3D动态人像生成

PV3D分别从独立的高斯分布中采样随机噪声来表征外表和运动，外表噪声生成视频的主体内容，控制人像的ID以及人脸的各个部分，运动噪声配合视频帧的时间戳控制当前帧的动作。

为了确保生成内容的真实性以及外表和运动的解耦，PV3D训练两个独立的判别器分别判定外表和运动的合理性。

该方法可以生成随机的人像视频以及相应的高质量的动态几何表面，让视频可以从任意角度进行渲染。

同时，该方法可以支持下游的应用任务，比如静态人像驱动，人像视频的重建以及对人像动作的修改，所有的结果均可以保持高的多视角一致性。

主流的3DGAN模型都脱胎于 StyleGAN结构。

因此这些模型均会将采样得到的噪声先映射到一个高维度的中间隐式编码 (intermidatelatentcode)，大量现有的研究表明这种结构的隐式空间包含了丰富的语义信息，可以用来控制生成的图像内容。

因此，最直接的拓展方式就是使用预训练的单帧3DGAN模型，通过学习一个额外的在隐式空间进行推理的时序模型对生成的内容进行合理的改变，从而生成3D人像视频。

然而，该方法的缺点是图片生成器和时序推理模型在不同的阶段分别被优化，导致最终的视频很难保持时间上的一致性。

另一种主流的视频生成模型使用稀疏训练的方式，在训练阶段直接随机生成视频中的少量帧，使用少数帧的时间戳编码运动信息，进一步的改变中间隐式编码从而一次性优化完整的生成器。

然而这种做法将全部的时序信息都包含在隐式空间中，导致最终的模型多样性较差、生成质量较低。

与上述方法不同，PV3D在原有GAN模型的基础上在特定尺度的生成模块中插入运动信息的编码层，这些编码层独立地将控制运动的噪声映射为隐式编码，使用modulatedconvolution操纵外表特征，再将操纵后的特征与原始特征融合，从而提高生成视频的时序一致性和运动多样性。

此外，本工作还研究了以下问题：

如何有效地在视频生成任务中利用渲染的视角先验信息

针对3D视频生成，如何设计合理的外表和运动判别器

PV3D模型基于最新的静态3DGAN模型EG3D进行开发，EG3D采用高效的3D表征Tri-plane实现图像生成。

在训练阶段，PV3D采用稀疏训练的策略，对于一个视频采样两个噪声、两个时间戳以及各自时刻对应的相机视角。

相对应的，模型生成两帧对应的3D表征进行渲染得到粗糙的结果。随后使用超分辨率模块将图片上采样。

PV3D设计了两个独立的判别器监督网络的学习，其中视频判别器会编码两帧的相机视角以及时间间隔去判断生成结果的合理性。实验部分评价指标

研究人员使用FVD来评估生成视频的质量。此外，为了评估多视角的一致性以及3D几何结构的质量，研究人员将3DGAN工作中常用的评价指标(生成人像的ID一致性、Chamfer距离、多视角的重投影误差)拓展到视频任务中。与基线的对比

研究人员首先采用同期的3D视频生成工作3DVidGen作为基线。此外，研究人员还基于SOTA的单帧3DGAN(EG3D和StyleNerf)和2D视频生成模型构建了三个基线模型。在3个公开数据集(VoxCeleb,CelebV-HQ,TalkingHead-1KH)上的实验结果表明，PV3D在生成视频的多样性，3D几何的质量，以及多视角一致性上均超越基线模型。

消融实验

研究人员对PV3D的各部分设计进行了消融实验，例如：运动信息的编码和注入的位置，运动信息的插入方式，相机视角的采样策略，以及视频判别器的设计。

团队介绍

目前，该论文已被ICLR2023接收。

作者团队由新加坡国立大学ShowLab和字节跳动组成。

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2023-02-22 21:45:12

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于人像,生成,模型,视频,生成,视频的资讯：

音频驱动人像视频模型：字节Loopy、CyberHost研究

...运动信息依赖，抛弃了空间模版的限制，最终生成更好的人像运动。这就不难理解为什么 Loopy 可以仅仅依靠音频，不需要任何空间辅助信号就可以生成自然逼真的人像视频了。除此以外，

2024-09-13 13:34:00

AI拜年火了，通义千问上线一张照片生成拜年视频

...定制全家福照片。目前国内外已经涌现了一批优秀的单人人像生成应用，但都无法满足全家福这一多人人像生成需求。相比单人人像生成，多人人像生成难度更高、技术更复杂。针对该问题，阿里通

2024-02-05 13:37:00

旷视开源的AI人像视频生成太炸了！输入照片即可模仿任意表情包

...机器之心编辑部日前，旷视科技发布了一项新的开源 AI 人像视频生成框架 ——MegActor。基于该框架，用户只需输入一张静态的肖像图片，以及一段视频（演讲、表情包、rap）

2024-06-28 09:41:00

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...效果，以下是几个官方放出的文生和图生视频案例，覆盖人像、动物、3D卡通等场景：从Demo来看，清影的生成效果虽然相比Sora等还有一定进步空间，但就整体而言流畅度、运动幅度等

2024-07-27 09:18:00

Pika、阿里同日炫技！国产视频大模型奋起直追

...的挑战。EMO不仅可以生成任意时长的说话视频，还能生成人像整个头部都发生丰富变化的说话视频，表情、五官、姿势都会产生非常自然的变化。在AI多模态领域，科技巨头、明星初创企业似

2024-03-01 09:26:00

视频生成群雄逐鹿，哪些重要问题待解？

...《可控人物视频生成》为主题，介绍支持混合模态控制的人像视频生成算法MegActor 系列工作。主题报告环节结束后的圆桌Panel，将由中存算董事长陈巍，上海交通大学人工智能研

2024-11-26 09:38:00

刚刚，重磅发布！阿里、腾讯、科大讯飞在列

...、抖音短视频（APP）等应用于图像、视频生成场景，基于人像理解技术和视频剪辑技术实现对用户上传图片或视频的渲染处理与格式转换

2023-06-20 17:00:00

我国自研视频大模型面向全球上线

...生视频”板块中，利用“角色一致性”功能，用户可上传人像图或自定义的角色图，通过文字描述就可指定图中角色在任意场景中做任意动作。该功能简化了视频制作流程，也提升了创作自由度。据

2024-08-02 03:11:00

AIGC潮起，如何“搅动”游戏、影视行业

...的预期。但直到第三代模型出来之前，我都不敢用它训练人像图片，因为（模型）对人像的五官无法正常表现，理解误差大，直到第三代模型专门针对人像进行了优化。”田海龙指着手机上他用不同

2024-03-04 09:42:00

更多关于科技的资讯：

春节新茶饮观察：书亦烧仙草乡镇店日均杯量1000杯，家庭聚会

春节假期历来是观察新消费趋势的重要窗口。近日,书亦烧仙草对外公布新春假期战报:平均每天售出招牌烧仙草26万杯、水果奶绿25万杯

2026-02-25 11:06:00

从“渠道战”到“心智战”：白酒春节营销背后的竞争新格局

春节作为国人最重要的传统节日，历来是白酒行业消费与品牌竞争的关键节点。从早期依靠渠道铺货和价格竞争，到如今注重文化内涵与情感联结

2026-02-25 11:06:00

京东健康解读春节健康消费趋势：灵芝粉、水蛭素等新成分增长超2

随着春节假期的结束，年货消费市场的全景图逐渐清晰。京东健康最新消费数据显示，新春健康消费已形成“送健康”、“管健康”、“养健康”三大鲜明趋势

2026-02-25 11:06:00

开局即冲刺！千灯镇全力以“复”奋战“开门红”

新春伊始，万象更新。昨天是春节假期后的首个工作日，千灯镇各企业纷纷擂响“奋进鼓”，以饱满的热情和昂扬的斗志投入到新一年的生产中

2026-02-25 10:56:00

年轻人涌进DIY拼豆店

店内有不同色号的豆子供客人挑选使用店内客人在专心拼豆雨晨被打翻的拼豆店员在帮助熨烫拼豆作品风起的拼豆作品工作日下午拼豆店座无虚席在追求效率与意义的当下

2026-02-25 10:58:00

“晋塔”首笔智能建筑机器人订单落地

春启新章，实干为先。近日，山西省工程机械有限公司2026年首笔“晋塔”智能建筑机器人订单落地，成功向中铁华铁工程设计集团有限公司完成设备交付

2026-02-25 08:36:00

杭州马力全开冲刺“万亿俱乐部”第七城

“开门红”！春节消费177.49亿元今年春节期间杭州消费市场很旺。“杭州消费在线”监测统计，2月15日至22日，杭州市批发

2026-02-25 08:51:00

好评中国｜返乡游异地游火热：小城消费蕴含市场大能量-中国吉林

长白时评评论员久泰平春节假期，不少年轻人选择返乡后入住酒店，也有越来越多家庭选择异地出游过年，酒店住宿消费随之迎来一波热潮

2026-02-25 10:13:00

小而美精而强厦门游戏企业业绩报喜

厦门网讯（厦门日报记者李晓平）近日，我市游戏行业头部企业——吉比特发布业绩预告显示，预计2025年实现归母净利润16

2026-02-25 08:44:00

德国总理默茨要来参观宇树科技

今明两天，德国总理默茨将正式开启他就任后的首次中国之行。根据德国总理府网站公布的行程，除了在北京与中国领导人会晤，他还将到访杭州

2026-02-25 09:52:00

厦门软件园多家企业节后首个工作日活动丰富多彩

在奥谱天成，员工们参与成语接龙获得礼物。（厦门日报记者卢剑豪摄）厦门网讯（厦门日报记者林露虹）昨日是春节后的首个工作日

2026-02-25 08:43:00

杭企喜提资本市场“开门红”

具身智能企业融资近 20 亿元每日商报讯马年春节假期前后，杭州企业上市与融资进程持续提速，资本市场“新春忙” 态势凸显

2026-02-25 07:20:00

开滦山矿公司为精密设备穿上“透明护甲”

河北新闻网讯（王闯、徐贵旺）近日，在开滦集团唐山矿业公司（简称“开滦山矿公司”）大井绞车提升作业现场，一项不起眼的小改造引发了员工们的热议

2026-02-24 20:46:00

“云端+实战”并进开滦股份吕家坨矿让智能“流量”变技术“能

河北新闻网讯（任蕊）近日，在开滦股份吕家坨矿综采一队的会议室里，采掘电钳工李彭超正通过手机反复观看一段微视频。视频中，“技术大拿”叶春海正在讲解如何查验智能化设备的数据包丢失率

2026-02-24 20:51:00

春节假期高速充电需求迎高峰安徽交控“小程序＋移动电站”护航

大皖新闻讯马年春节假期落幕，在春运返乡返程的车流高峰中，新能源汽车的“补能”问题成为社会关注焦点。记者从安徽交控资源公司所属交控能源公司获悉

2026-02-24 21:28:00

头条订阅服务

首个3d人像视频生成模型来了