• 我的订阅
  • 科技

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

类别:科技 发布时间:2024-04-09 14:00:00 来源:砍柴网

在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署在出门问问的 AIGC 产品——「奇妙元」和「奇妙问」中,持续扩大其在行业内的影响力和用户基础。

出门问问数字人系统持续迭代

自出门问问启动数字人服务以来,其技术团队已经多次进行数字人系统的迭代更新。如今的第四代数字人系统——基于多尺度3D模型的WetaAvatar 4.0,通过整合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术,我们进一步强化了数字人的呈现效果,实现高度仿真的外观,同时还精心打造了生动的表情,媲美真人。

综合来看,在WetaAvatar 4.0中,不论是数字人进行讲话、唱歌或者静音状态,其表现均优于前代,技术指标Sync-C的数值普遍高于WetaAvatar 3.0,清晰度也相比上代有较大提升。

Sync-C (SyncNet Confidence):使用预训练的衡量音画同步性的模型 SyncNet 计算的音画同步置信度。相同的驱动音频和驱动视频,数值越高越好。

TTS引擎MeetVoice Pro赋能数字人

在第四代数字人系统WetaAvatar 4.0中,用户提交文本后,系统将调用出门问问的TTS引擎MeetVoice Pro,该引擎基于大语言模型—「序列猴子」,支持产生清晰自然的语音输出。随后,这段语音被输入数字人系统,确保视频中的数字人物可以以精准的口型匹配、自然的面部表情及流畅的身体动作呈现。通过这种方式,我们将文本信息转化为一个高度真实的数字化视频,为用户提供视觉与听觉相结合的真实体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

实时语音解析能力— 本技术能够即时准确地从语音音频中提取信息,并转换成可操控虚拟形象的音频信号。

精确的口型驱动能力 — 采用深度学习模型,将音频信号精准地转化为自然流畅的口型及面部动作,提供真实的视听体验。

领先的音频编辑能力 — 本系统整合了魔音工坊配音的核心功能,包含快速准确地调整多音字和韵律,以确保配音的专业水准,特别适合虚拟主持人等应用场合。

三大核心特色 打造超真实数字人体验

WetaAvatar 4.0采用了一套先进的人脸重建与生成机制。首先,通过人脸重建模型捕捉到人脸的核心特征数据,这一数据反映了人脸的不变属性。然后,人脸生成模型使用这些基础数据,并结合具体的人脸图像及配套的音频信息进行处理,以此同步创造出与音频匹配的嘴型动作和表情。这项技术的应用确保了数字人的表现不仅仅是视觉上的逼真,还能在语音和表情的同步上达到极高的自然度,大幅提升了数字人的真实感。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

全新升级后的第四代数字人系统具有“精致外观”、“迅捷响应”、和“多样选择”三大核心特色。

精致外观

利用最新数字人系统WetaAvatar 4.0,出门问问的数字人实现了前所未有的逼真还原。目前,数字人不仅拥有极大的真实感,嘴形与声音的同步精度也不断突破,带来了动态上的全新提升——让数字人的每一个微笑、每一次皱眉都宛若真人。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

迅捷响应

最新数字人系统WetaAvatar 4.0基于强化的底层架构,极大提升了合成速度并显著降低了延迟。在普通消费级显卡上,系统能以0.3的实时率合成视频(即1分钟的视频仅需20秒左右)。同时,实时驱动延迟被控制在1秒内,大幅减少用户等待时间,实现流畅无缝的迅捷体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

多样选择

出门问问倾力打造,旨在拓展数字人的多样性:从融合多音色、多语种的声音,到整合不同年龄和性别的人物形象,再到多角度、多动作的灵活展示,这一全新升级的数字人系统实现了质的飞跃,极大降低了数据集成的复杂度,为创建丰富多彩的数字世界提供了无限可能。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

三大技术指标 多方面综合提升性能

WetaAvatar 4.0系统的最新升级实现了多维度的重大突破,推动行业标准再上新高。本次升级的全面性能,可通过以下三个关键技术指标以及相应的demo展示进行深入评估与体验:

FID (Fréchet Inception Distance)

使用预训练的图像分类模型 Inception v3 网络抽取图像特征,假设特征向量的分布为高斯分布,计算真实图片序列和生成图片序列两个高斯分布的均值和协方差矩阵。通过测量两个概率分布之间的“距离”(相似程度)来评估生成图像序列与真实图像序列的相似程度。数值越低越好。

SSIM(Structural Similarity Index)

SSIM全称为结构相似性指数,是一种用于衡量两幅图像相似度的指标。它是一种全参考的指标,即它需要一张原始的图像作为参考。SSIM将图像的亮度、对比度和结构等因素考虑在内,通过比较这些因素的相似性来计算两幅图像之间的相似度。数值越高越好。

PSNR(Peak Signal-to-Noise Ratio)

PSNR全称为峰值信噪比,是一种常用于衡量图像或音频质量的指标。它是通过比较原始信号与经过压缩或处理后的信号之间的信噪比来评估质量的。数值越高越好。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

根据综合指标测算和数据对比分析,得出结论:WetaAvatar 4.0在关键性能参数上相较于其前代系统取得了实质性进展。具体而言,在图像的真实感呈现、角色相似度的精确匹配,以及视频输出质量上,均体现出明显提升。

打造出更加人性化、情感丰富的数字伴侣

出门问问的技术团队持续探索创新,不仅将这一全套技术精益求精,更确保其在行业中处于领先地位,带给ToC和ToB客户前所未有的高质量数字人使用体验,速度与效果兼备。

出门问问AIGC产品——「奇妙元」与「奇妙问」现已全面集成我们最新一代的数字人系统。截至目前,「奇妙元」与「奇妙问」已上线超过200种数字人形象,并且我们正致力于对这些形象进行持续的优化迭代,以提供更优质的数字化体验。

出门问问的自研大模型「序列猴子」,其以语言为核心的能力体系,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展和强化数字人的能力范围。

面向未来,出门问问将继续秉承深耕数字人技术的理念,逐步将其应用到更广泛的产品服务中。我们的目标是利用先进的智能技术,为用户打造出更加人性化、情感丰富的数字伴侣,可全天候提供陪伴。这将使人机互动变得更为自然,并将AI融入每个人的日常生活,引领智慧生活的新潮。

用户福利来袭

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

注册「奇妙元」后,

点击我的 - CDK兑换码,

输入兑换码:AIGC2024,

免费获得数字人合成时长。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-09 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

柯尼卡美能达重磅亮相德鲁巴
...见未来印刷的无限潜能SeethePotentialintheFutureofPrint”为主题重磅亮相本届德鲁巴,2400平方米的展位上不仅展示了先进的端到端智能工厂数字化生产线
2024-06-04 09:07:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...名城提档升级、实施高端软件铸魂工程的重要举措。会上重磅发布新一代浪潮海岳PaaS平台iGIX、企业服务大模型inGPT,成立低代码开源软件生态联盟和济南软件产业联盟。软件是数
2023-09-08 17:05:00
三箭齐发 西湖论剑重磅成果助力打造安全新质生产力
...安全变革”“安全运营智能化、实战化”三大核心议题,重磅发布《企业数据资源入表实践白皮书》《重大活动网络安全保障建设及运营指南》和AI安全八大应用趋势等一系列成果
2024-05-24 14:16:00
2023上海车展正式开幕,多款重磅新车亮相
4月18日,2023上海车展正式开幕,多款重磅新车亮相,让人眼花缭乱。宝马集团电动车齐聚上海车展,宝马、MINI、劳斯莱斯三大品牌发力。在本次车展上,宝马将首发五款新能源车型、三
2023-04-18 12:36:00
...生态,共商筑牢“数字安全屏障”的创新方案。本届大会重磅发布“网络内生安全试验场NEST2.0”等3项创新成果及两份前瞻性白皮书,并深度融合虚拟现实、人工智能等高新技术,搭建沉
2023-01-13 06:05:00
AI数智新引擎丨安道教育携重磅教装产品亮相第85届教装展
...道教育以“AI数智新引擎,开启教育新态势”为主题,携重磅教育装备产品和服务亮相。在AI大数据的推动下,教装行业正迎变革机遇。如何利用AI更好地赋能教育?在这场展示会上,安道给
2025-05-06 17:45:00
ETAP全新数字孪生平台:“盘活”未来电网价值链的创新路径
...是在这一需求背景下,施耐德电气在2023年创新峰会上,重磅发布了ETAP全新电气系统数字孪生平台。这一平台将能源管理和工程解决方案的全球领导者ETAP与ALPI
2023-07-07 16:00:00
全新普拉多领衔、X3在列,2024值得看的6款重磅合资SUV
转眼间,2023年即将结束,2024年已在路上。今年一年,汽车市场照样是精彩纷呈,新车层出不穷,可以说是“你方唱罢我登场”。放眼2024年,也将有多款新车登场,比如在合资SUV市
2024-01-02 09:47:00
凌云光•元客视界携全新XR+VP架构亮相上海VPS&DHDC 2023
...会同期,元客视界携全新XR+VP架构和智能数字人应用技术重磅亮相。UE5.2+Rivermax2110 全新XR+VP架构打造超高清虚拟制作新高度从绿幕抠像到虚拟影棚
2023-06-25 13:00:00
更多关于科技的资讯:
□南京日报/紫金山新闻记者张甜甜 通讯员夏俊林娜10月31日,南京市统计局、国家统计局南京调查队发布南京经济“三季报”
2025-11-01 09:44:00
上海虹桥医院癫痫专病诊疗新高度:个性化方案,全程化守护
癫痫发作的不可预测性及其对记忆、情绪、社交、学业与工作等方面的深远影响,构成了广大患者面临的核心挑战。诊断的复杂、治疗方案的普适性困境以及持续管理的缺失
2025-11-01 10:05:00
第十季炒股大赛冠军诞生:光伏逆变器行业龙头涨幅登顶
在《大众证券报》读者俱乐部第十季炒股比赛中,选手“馨小憩”以159.84元/股推荐的阳光电源(300274),荐股涨幅19
2025-11-01 11:00:00
近日,国内首款真空高压铸造人形机器人腿部骨骼零部件在中信戴卡股份有限公司研制成功并生产下线,首批20件量产产品已发往国内客户
2025-11-01 11:10:00
视频制作:陈希河北新闻网讯(记者 李春炜)随着AI技术飞速发展,在今年的双十一期间,AI笔记本也成为爆款产品。近日,记者走进安徽合肥的联想PC设备研发和制造基地
2025-11-01 15:39:00
10月30日,“版权强企燕赵行”活动走进保定市高阳县。活动通过进企问需、校企对接、版权法律法规科普、版权服务平台及版权区块链平台推介等方式
2025-11-01 15:47:00
10月30日,在由盖世汽车主办的2025第七届“金辑奖”颁奖盛典上,东软集团凭借在智能汽车互联领域持续的产品创新与卓越的全球化实践
2025-11-01 16:16:00
钻戒定制怎么选?2025五大宝藏品牌全解析,一篇避坑
准备结婚选钻戒,却被天然钻的高价劝退?想入手培育钻戒,又怕遇到“参数虚标”“售后无保障”的问题?2025年培育钻石市场规模突破300亿元
2025-11-01 16:17:00
第三十七届中国仿真大会在合肥市庐阳区召开
大皖新闻讯 11月1日,第三十七届中国仿真大会在合肥市庐阳区召开,大会以“数智仿真、新质发展”为主题,吸引全国约千名学者与业界代表
2025-11-02 00:04:00
“科大讯飞1024科博展”亮点抢先看!现场黑科技拉满,免费开放
大皖新闻讯 想让AI陪你对弈吗?想穿越时空与孙悟空来场“智慧交锋”吗?第八届世界声博会暨2025科大讯飞全球1024开发者节科博展将于11月2日至6日在合肥体育中心启幕
2025-11-02 00:04:00
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00