• 我的订阅
  • 科技

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

类别:科技 发布时间:2024-04-09 14:00:00 来源:砍柴网

在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署在出门问问的 AIGC 产品——「奇妙元」和「奇妙问」中,持续扩大其在行业内的影响力和用户基础。

出门问问数字人系统持续迭代

自出门问问启动数字人服务以来,其技术团队已经多次进行数字人系统的迭代更新。如今的第四代数字人系统——基于多尺度3D模型的WetaAvatar 4.0,通过整合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术,我们进一步强化了数字人的呈现效果,实现高度仿真的外观,同时还精心打造了生动的表情,媲美真人。

综合来看,在WetaAvatar 4.0中,不论是数字人进行讲话、唱歌或者静音状态,其表现均优于前代,技术指标Sync-C的数值普遍高于WetaAvatar 3.0,清晰度也相比上代有较大提升。

Sync-C (SyncNet Confidence):使用预训练的衡量音画同步性的模型 SyncNet 计算的音画同步置信度。相同的驱动音频和驱动视频,数值越高越好。

TTS引擎MeetVoice Pro赋能数字人

在第四代数字人系统WetaAvatar 4.0中,用户提交文本后,系统将调用出门问问的TTS引擎MeetVoice Pro,该引擎基于大语言模型—「序列猴子」,支持产生清晰自然的语音输出。随后,这段语音被输入数字人系统,确保视频中的数字人物可以以精准的口型匹配、自然的面部表情及流畅的身体动作呈现。通过这种方式,我们将文本信息转化为一个高度真实的数字化视频,为用户提供视觉与听觉相结合的真实体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

实时语音解析能力— 本技术能够即时准确地从语音音频中提取信息,并转换成可操控虚拟形象的音频信号。

精确的口型驱动能力 — 采用深度学习模型,将音频信号精准地转化为自然流畅的口型及面部动作,提供真实的视听体验。

领先的音频编辑能力 — 本系统整合了魔音工坊配音的核心功能,包含快速准确地调整多音字和韵律,以确保配音的专业水准,特别适合虚拟主持人等应用场合。

三大核心特色 打造超真实数字人体验

WetaAvatar 4.0采用了一套先进的人脸重建与生成机制。首先,通过人脸重建模型捕捉到人脸的核心特征数据,这一数据反映了人脸的不变属性。然后,人脸生成模型使用这些基础数据,并结合具体的人脸图像及配套的音频信息进行处理,以此同步创造出与音频匹配的嘴型动作和表情。这项技术的应用确保了数字人的表现不仅仅是视觉上的逼真,还能在语音和表情的同步上达到极高的自然度,大幅提升了数字人的真实感。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

全新升级后的第四代数字人系统具有“精致外观”、“迅捷响应”、和“多样选择”三大核心特色。

精致外观

利用最新数字人系统WetaAvatar 4.0,出门问问的数字人实现了前所未有的逼真还原。目前,数字人不仅拥有极大的真实感,嘴形与声音的同步精度也不断突破,带来了动态上的全新提升——让数字人的每一个微笑、每一次皱眉都宛若真人。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

迅捷响应

最新数字人系统WetaAvatar 4.0基于强化的底层架构,极大提升了合成速度并显著降低了延迟。在普通消费级显卡上,系统能以0.3的实时率合成视频(即1分钟的视频仅需20秒左右)。同时,实时驱动延迟被控制在1秒内,大幅减少用户等待时间,实现流畅无缝的迅捷体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

多样选择

出门问问倾力打造,旨在拓展数字人的多样性:从融合多音色、多语种的声音,到整合不同年龄和性别的人物形象,再到多角度、多动作的灵活展示,这一全新升级的数字人系统实现了质的飞跃,极大降低了数据集成的复杂度,为创建丰富多彩的数字世界提供了无限可能。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

三大技术指标 多方面综合提升性能

WetaAvatar 4.0系统的最新升级实现了多维度的重大突破,推动行业标准再上新高。本次升级的全面性能,可通过以下三个关键技术指标以及相应的demo展示进行深入评估与体验:

FID (Fréchet Inception Distance)

使用预训练的图像分类模型 Inception v3 网络抽取图像特征,假设特征向量的分布为高斯分布,计算真实图片序列和生成图片序列两个高斯分布的均值和协方差矩阵。通过测量两个概率分布之间的“距离”(相似程度)来评估生成图像序列与真实图像序列的相似程度。数值越低越好。

SSIM(Structural Similarity Index)

SSIM全称为结构相似性指数,是一种用于衡量两幅图像相似度的指标。它是一种全参考的指标,即它需要一张原始的图像作为参考。SSIM将图像的亮度、对比度和结构等因素考虑在内,通过比较这些因素的相似性来计算两幅图像之间的相似度。数值越高越好。

PSNR(Peak Signal-to-Noise Ratio)

PSNR全称为峰值信噪比,是一种常用于衡量图像或音频质量的指标。它是通过比较原始信号与经过压缩或处理后的信号之间的信噪比来评估质量的。数值越高越好。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

根据综合指标测算和数据对比分析,得出结论:WetaAvatar 4.0在关键性能参数上相较于其前代系统取得了实质性进展。具体而言,在图像的真实感呈现、角色相似度的精确匹配,以及视频输出质量上,均体现出明显提升。

打造出更加人性化、情感丰富的数字伴侣

出门问问的技术团队持续探索创新,不仅将这一全套技术精益求精,更确保其在行业中处于领先地位,带给ToC和ToB客户前所未有的高质量数字人使用体验,速度与效果兼备。

出门问问AIGC产品——「奇妙元」与「奇妙问」现已全面集成我们最新一代的数字人系统。截至目前,「奇妙元」与「奇妙问」已上线超过200种数字人形象,并且我们正致力于对这些形象进行持续的优化迭代,以提供更优质的数字化体验。

出门问问的自研大模型「序列猴子」,其以语言为核心的能力体系,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展和强化数字人的能力范围。

面向未来,出门问问将继续秉承深耕数字人技术的理念,逐步将其应用到更广泛的产品服务中。我们的目标是利用先进的智能技术,为用户打造出更加人性化、情感丰富的数字伴侣,可全天候提供陪伴。这将使人机互动变得更为自然,并将AI融入每个人的日常生活,引领智慧生活的新潮。

用户福利来袭

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

注册「奇妙元」后,

点击我的 - CDK兑换码,

输入兑换码:AIGC2024,

免费获得数字人合成时长。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-09 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

柯尼卡美能达重磅亮相德鲁巴
...见未来印刷的无限潜能SeethePotentialintheFutureofPrint”为主题重磅亮相本届德鲁巴,2400平方米的展位上不仅展示了先进的端到端智能工厂数字化生产线
2024-06-04 09:07:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...名城提档升级、实施高端软件铸魂工程的重要举措。会上重磅发布新一代浪潮海岳PaaS平台iGIX、企业服务大模型inGPT,成立低代码开源软件生态联盟和济南软件产业联盟。软件是数
2023-09-08 17:05:00
三箭齐发 西湖论剑重磅成果助力打造安全新质生产力
...安全变革”“安全运营智能化、实战化”三大核心议题,重磅发布《企业数据资源入表实践白皮书》《重大活动网络安全保障建设及运营指南》和AI安全八大应用趋势等一系列成果
2024-05-24 14:16:00
2023上海车展正式开幕,多款重磅新车亮相
4月18日,2023上海车展正式开幕,多款重磅新车亮相,让人眼花缭乱。宝马集团电动车齐聚上海车展,宝马、MINI、劳斯莱斯三大品牌发力。在本次车展上,宝马将首发五款新能源车型、三
2023-04-18 12:36:00
...生态,共商筑牢“数字安全屏障”的创新方案。本届大会重磅发布“网络内生安全试验场NEST2.0”等3项创新成果及两份前瞻性白皮书,并深度融合虚拟现实、人工智能等高新技术,搭建沉
2023-01-13 06:05:00
AI数智新引擎丨安道教育携重磅教装产品亮相第85届教装展
...道教育以“AI数智新引擎,开启教育新态势”为主题,携重磅教育装备产品和服务亮相。在AI大数据的推动下,教装行业正迎变革机遇。如何利用AI更好地赋能教育?在这场展示会上,安道给
2025-05-06 17:45:00
ETAP全新数字孪生平台:“盘活”未来电网价值链的创新路径
...是在这一需求背景下,施耐德电气在2023年创新峰会上,重磅发布了ETAP全新电气系统数字孪生平台。这一平台将能源管理和工程解决方案的全球领导者ETAP与ALPI
2023-07-07 16:00:00
全新普拉多领衔、X3在列,2024值得看的6款重磅合资SUV
转眼间,2023年即将结束,2024年已在路上。今年一年,汽车市场照样是精彩纷呈,新车层出不穷,可以说是“你方唱罢我登场”。放眼2024年,也将有多款新车登场,比如在合资SUV市
2024-01-02 09:47:00
凌云光•元客视界携全新XR+VP架构亮相上海VPS&DHDC 2023
...会同期,元客视界携全新XR+VP架构和智能数字人应用技术重磅亮相。UE5.2+Rivermax2110 全新XR+VP架构打造超高清虚拟制作新高度从绿幕抠像到虚拟影棚
2023-06-25 13:00:00
更多关于科技的资讯:
冀北绿电交易市场规模跃居全国首位
2025-12-28 19:37:00
电商物流共享给南和宠物食品带来什么——河北特色产业集群共享智造故事(九)漫步邢台市南和区,宠物元素扮靓了街头巷尾。一家家宠物食品公司车间厂区里
2025-12-28 07:44:00
12月26日,位于杭州云栖小镇的国家机器人检测与评定中心(总部)浙江检测中心(以下简称“浙江检测中心”)正式启用。机器人从样机走向量产
2025-12-27 08:10:00
喜报|米糠云顺利通过双ISO体系认证,安全与品质再上新台阶
近日,深圳市米糠云科技有限公司顺利通过ISO27001信息安全管理体系认证与ISO9001质量管理体系认证。这标志着公司在信息安全管理和质量管理方面达到了国际标准
2025-12-27 14:34:00
退货仓分拣 “堵点” 怎么破?快宝共配给出答案
近年来,电商与直播电商的迅猛发展,不仅催生出庞大的正向物流需求,更让逆向物流成为快递行业名副其实的“蓝海”。消费者退换货需求呈爆炸式增长
2025-12-27 14:36:00
京东跨年盛典开启 送好礼官方直降五折起 还能抽祝福“大排面”
岁末迎新,跨年不只是一种仪式,更是一场表达与传递的情感盛宴。京东今年再度打造“年度宠粉”跨年盛典,不仅有众多官方直降5折起的尖货好物
2025-12-27 14:36:00
专为X3D处理器打造,技嘉X870E X3D系列主板全面上线
2025年最热门的CPU毫无疑问当属AMD锐龙X3D系列,而技嘉作为AMD核心合作伙伴之一,专为AMD X3D系列处理器量身定制了X870E X3D系列主板
2025-12-27 14:37:00
58同城2025中国好雇主盛典在深举行,勾勒数智时代雇主价值新坐标
12月26日,58同城2025“中国好雇主”盛典在深圳举办。作为国内极具影响力的雇主品牌盛会,本届盛典以“数智驱动,百业共生”为核心主题
2025-12-27 14:38:00
从“终于有了”到“真的好用”:“山大v卡通”鸿蒙版如何回应期待,定义智慧校园新体验
鲁网12月27日讯“终于有NFC校园卡了,自己的学校必须给个好评!”“NFC终于上了!” 在华为应用商店的评论区,山东大学师生们的真实留言
2025-12-27 17:30:00
想在短视频的蓝海遨游?别错过这部“实战指南”
都说“万物皆可短视频”,哪些内容让你眼前一亮?电筒拍大片、夜空光魔法、特效变装秀、用烘焙复刻文物、把大好河山“穿”在身上……在这个创意无限的世界里
2025-12-27 19:55:00
“新”中有数|福建首张文旅研学领域数据产权登记证书落地福州
福州新闻网12月27日讯(记者 颜澜萍)近日,福州冶城集团所属企业福建百宝图科技有限公司通过福建省大数据集团旗下福建省数据产权登记平台
2025-12-27 21:00:00
12月26日,杭州市市场监督管理局召开专题新闻通气会,对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果
2025-12-27 07:39:00
昨天下午,2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿,大赛共收到来自英国
2025-12-27 07:39:00
杭州市西湖区后陡门58号,原本只是城市边缘一个普通的小村子,仅仅三年,这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间
2025-12-27 07:39:00
装有红酒的纸箱从1米多的高度多次抛下,又被送入抗压测试机内,接受300公斤的压力测试,再经斜面冲击台俯冲撞向铁板,红酒依然完好无损……经过这一系列流程
2025-12-27 07:39:00