• 我的订阅
  • 科技

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

类别:科技 发布时间:2024-04-09 14:00:00 来源:砍柴网

在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署在出门问问的 AIGC 产品——「奇妙元」和「奇妙问」中,持续扩大其在行业内的影响力和用户基础。

出门问问数字人系统持续迭代

自出门问问启动数字人服务以来,其技术团队已经多次进行数字人系统的迭代更新。如今的第四代数字人系统——基于多尺度3D模型的WetaAvatar 4.0,通过整合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术,我们进一步强化了数字人的呈现效果,实现高度仿真的外观,同时还精心打造了生动的表情,媲美真人。

综合来看,在WetaAvatar 4.0中,不论是数字人进行讲话、唱歌或者静音状态,其表现均优于前代,技术指标Sync-C的数值普遍高于WetaAvatar 3.0,清晰度也相比上代有较大提升。

Sync-C (SyncNet Confidence):使用预训练的衡量音画同步性的模型 SyncNet 计算的音画同步置信度。相同的驱动音频和驱动视频,数值越高越好。

TTS引擎MeetVoice Pro赋能数字人

在第四代数字人系统WetaAvatar 4.0中,用户提交文本后,系统将调用出门问问的TTS引擎MeetVoice Pro,该引擎基于大语言模型—「序列猴子」,支持产生清晰自然的语音输出。随后,这段语音被输入数字人系统,确保视频中的数字人物可以以精准的口型匹配、自然的面部表情及流畅的身体动作呈现。通过这种方式,我们将文本信息转化为一个高度真实的数字化视频,为用户提供视觉与听觉相结合的真实体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

实时语音解析能力— 本技术能够即时准确地从语音音频中提取信息,并转换成可操控虚拟形象的音频信号。

精确的口型驱动能力 — 采用深度学习模型,将音频信号精准地转化为自然流畅的口型及面部动作,提供真实的视听体验。

领先的音频编辑能力 — 本系统整合了魔音工坊配音的核心功能,包含快速准确地调整多音字和韵律,以确保配音的专业水准,特别适合虚拟主持人等应用场合。

三大核心特色 打造超真实数字人体验

WetaAvatar 4.0采用了一套先进的人脸重建与生成机制。首先,通过人脸重建模型捕捉到人脸的核心特征数据,这一数据反映了人脸的不变属性。然后,人脸生成模型使用这些基础数据,并结合具体的人脸图像及配套的音频信息进行处理,以此同步创造出与音频匹配的嘴型动作和表情。这项技术的应用确保了数字人的表现不仅仅是视觉上的逼真,还能在语音和表情的同步上达到极高的自然度,大幅提升了数字人的真实感。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

全新升级后的第四代数字人系统具有“精致外观”、“迅捷响应”、和“多样选择”三大核心特色。

精致外观

利用最新数字人系统WetaAvatar 4.0,出门问问的数字人实现了前所未有的逼真还原。目前,数字人不仅拥有极大的真实感,嘴形与声音的同步精度也不断突破,带来了动态上的全新提升——让数字人的每一个微笑、每一次皱眉都宛若真人。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

迅捷响应

最新数字人系统WetaAvatar 4.0基于强化的底层架构,极大提升了合成速度并显著降低了延迟。在普通消费级显卡上,系统能以0.3的实时率合成视频(即1分钟的视频仅需20秒左右)。同时,实时驱动延迟被控制在1秒内,大幅减少用户等待时间,实现流畅无缝的迅捷体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

多样选择

出门问问倾力打造,旨在拓展数字人的多样性:从融合多音色、多语种的声音,到整合不同年龄和性别的人物形象,再到多角度、多动作的灵活展示,这一全新升级的数字人系统实现了质的飞跃,极大降低了数据集成的复杂度,为创建丰富多彩的数字世界提供了无限可能。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

三大技术指标 多方面综合提升性能

WetaAvatar 4.0系统的最新升级实现了多维度的重大突破,推动行业标准再上新高。本次升级的全面性能,可通过以下三个关键技术指标以及相应的demo展示进行深入评估与体验:

FID (Fréchet Inception Distance)

使用预训练的图像分类模型 Inception v3 网络抽取图像特征,假设特征向量的分布为高斯分布,计算真实图片序列和生成图片序列两个高斯分布的均值和协方差矩阵。通过测量两个概率分布之间的“距离”(相似程度)来评估生成图像序列与真实图像序列的相似程度。数值越低越好。

SSIM(Structural Similarity Index)

SSIM全称为结构相似性指数,是一种用于衡量两幅图像相似度的指标。它是一种全参考的指标,即它需要一张原始的图像作为参考。SSIM将图像的亮度、对比度和结构等因素考虑在内,通过比较这些因素的相似性来计算两幅图像之间的相似度。数值越高越好。

PSNR(Peak Signal-to-Noise Ratio)

PSNR全称为峰值信噪比,是一种常用于衡量图像或音频质量的指标。它是通过比较原始信号与经过压缩或处理后的信号之间的信噪比来评估质量的。数值越高越好。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

根据综合指标测算和数据对比分析,得出结论:WetaAvatar 4.0在关键性能参数上相较于其前代系统取得了实质性进展。具体而言,在图像的真实感呈现、角色相似度的精确匹配,以及视频输出质量上,均体现出明显提升。

打造出更加人性化、情感丰富的数字伴侣

出门问问的技术团队持续探索创新,不仅将这一全套技术精益求精,更确保其在行业中处于领先地位,带给ToC和ToB客户前所未有的高质量数字人使用体验,速度与效果兼备。

出门问问AIGC产品——「奇妙元」与「奇妙问」现已全面集成我们最新一代的数字人系统。截至目前,「奇妙元」与「奇妙问」已上线超过200种数字人形象,并且我们正致力于对这些形象进行持续的优化迭代,以提供更优质的数字化体验。

出门问问的自研大模型「序列猴子」,其以语言为核心的能力体系,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展和强化数字人的能力范围。

面向未来,出门问问将继续秉承深耕数字人技术的理念,逐步将其应用到更广泛的产品服务中。我们的目标是利用先进的智能技术,为用户打造出更加人性化、情感丰富的数字伴侣,可全天候提供陪伴。这将使人机互动变得更为自然,并将AI融入每个人的日常生活,引领智慧生活的新潮。

用户福利来袭

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

注册「奇妙元」后,

点击我的 - CDK兑换码,

输入兑换码:AIGC2024,

免费获得数字人合成时长。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-09 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

柯尼卡美能达重磅亮相德鲁巴
...见未来印刷的无限潜能SeethePotentialintheFutureofPrint”为主题重磅亮相本届德鲁巴,2400平方米的展位上不仅展示了先进的端到端智能工厂数字化生产线
2024-06-04 09:07:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...名城提档升级、实施高端软件铸魂工程的重要举措。会上重磅发布新一代浪潮海岳PaaS平台iGIX、企业服务大模型inGPT,成立低代码开源软件生态联盟和济南软件产业联盟。软件是数
2023-09-08 17:05:00
三箭齐发 西湖论剑重磅成果助力打造安全新质生产力
...安全变革”“安全运营智能化、实战化”三大核心议题,重磅发布《企业数据资源入表实践白皮书》《重大活动网络安全保障建设及运营指南》和AI安全八大应用趋势等一系列成果
2024-05-24 14:16:00
2023上海车展正式开幕,多款重磅新车亮相
4月18日,2023上海车展正式开幕,多款重磅新车亮相,让人眼花缭乱。宝马集团电动车齐聚上海车展,宝马、MINI、劳斯莱斯三大品牌发力。在本次车展上,宝马将首发五款新能源车型、三
2023-04-18 12:36:00
...生态,共商筑牢“数字安全屏障”的创新方案。本届大会重磅发布“网络内生安全试验场NEST2.0”等3项创新成果及两份前瞻性白皮书,并深度融合虚拟现实、人工智能等高新技术,搭建沉
2023-01-13 06:05:00
AI数智新引擎丨安道教育携重磅教装产品亮相第85届教装展
...道教育以“AI数智新引擎,开启教育新态势”为主题,携重磅教育装备产品和服务亮相。在AI大数据的推动下,教装行业正迎变革机遇。如何利用AI更好地赋能教育?在这场展示会上,安道给
2025-05-06 17:45:00
ETAP全新数字孪生平台:“盘活”未来电网价值链的创新路径
...是在这一需求背景下,施耐德电气在2023年创新峰会上,重磅发布了ETAP全新电气系统数字孪生平台。这一平台将能源管理和工程解决方案的全球领导者ETAP与ALPI
2023-07-07 16:00:00
全新普拉多领衔、X3在列,2024值得看的6款重磅合资SUV
转眼间,2023年即将结束,2024年已在路上。今年一年,汽车市场照样是精彩纷呈,新车层出不穷,可以说是“你方唱罢我登场”。放眼2024年,也将有多款新车登场,比如在合资SUV市
2024-01-02 09:47:00
凌云光•元客视界携全新XR+VP架构亮相上海VPS&DHDC 2023
...会同期,元客视界携全新XR+VP架构和智能数字人应用技术重磅亮相。UE5.2+Rivermax2110 全新XR+VP架构打造超高清虚拟制作新高度从绿幕抠像到虚拟影棚
2023-06-25 13:00:00
更多关于科技的资讯:
产学研协同攻坚 科研成果走向“生产线”每日商报讯 假期临近,浙江理工大学的纺织实验室仪器却低鸣不断,发出“滋滋”的运转声
2026-02-11 07:19:00
近日,字节跳动推出的AI视频生成模型Seedance2.0在海内外互联网上再度刷屏。据官方介绍,该模型能够根据文本或图像生成电影级视频
2026-02-10 23:41:00
江南时报讯 近日,苏州农商银行与人保财险苏州市分公司深化协同,成功落地全国首单银保合作“科创贷”。该企业作为国家级高新技术企业
2026-02-10 21:42:00
西秀食品“双星”冲刺首季“开门红”
连日来,位于西秀区的贵州安顺云鹫食品有限公司和贵州好味达食品有限公司呈现一派热火朝天的生产景象。作为本土食品行业的标杆企业
2026-02-10 22:10:00
锦江国际集团启动马年春节多元促消费活动,激发假日市场新活力
马年春节临近,锦江国际集团依托“吃、住、行、游”全产业链优势,为海内外宾客准备了丰富的年娱、年味项目,陪伴大家一起过个精彩中国年
2026-02-10 17:24:00
潮新闻讯 目光所及,即是世界。此刻,我们站在迈向高水平科技自立自强的时代关口。“科技创新和产业创新深度融合”“概念验证”“中试平台”“职务科技成果赋权”“资产单列管理”“技术经理人”等成为了中国科技成果转化行业的热词
2026-02-10 18:06:00
中国消费者报北京讯(记者吴博峰)记者近日从江苏省储能行业协会获悉,即将于今年5月举办的CESC2026第四届储能大会主论坛将汇聚行业各方人士
2026-02-10 18:33:00
中国消费者报报道(记者何永鹏)近日,由市场监管总局发展研究中心、中国社会科学院财经战略研究院课题组联合完成的《2025直播电商行业发展白皮书》(以下简称《白皮书》)正式发布
2026-02-10 19:03:00
2025年池州市累计完成以旧换新交易11.24万笔 带动社会消费22.6亿元
大皖新闻讯 记者从2月9日召开的池州市提质增效实施消费品以旧换新政策新闻发布会上获悉,2025年,池州市累计完成消费品以旧换新交易11
2026-02-10 18:14:00
记者今天(2月10日)了解到,市场监管总局(国家标准委)批准发布一批重要国家标准。在新兴领域方面,发布脑机接口、数字孪生等5项国家标准
2026-02-10 14:15:00
滨州移动科技赋能年货盛会 铸就网络保障新典范
鲁网2月10日讯2026年2月6日至8日,“购在中国·2026滨州迎新春消费季暨乐购滨州年货大集”在滨州市全民健康文化中心体育场南广场盛大举办
2026-02-10 15:09:00
西北工业大学科研团队在脑机接口关键领域取得新突破
想象一下,当瘫痪者用意念操控机械臂,稳稳端起水杯;当失语者的思维被直接“翻译”成流畅语音;当帕金森患者的颤抖经神经调控逐渐平息……这些曾出现在科幻电影里的场景
2026-02-10 16:06:00
创新潮涌!温州乐清科技创新指数连续八年领跑全省
日前,位于温州乐清北白象镇中方智能园区的温州合力自动化仪表有限公司,成功研发出AI智能物联直行程电动执行器。作为流体控制领域的领军企业
2026-02-10 16:20:00
诺特兰德公益创新获认可,一举摘得公益节三项荣誉
鲁网2月10日讯1月22日至23日,第十五届公益节暨2025ESG影响力年会在北京举行。全球膳食营养品牌诺特兰德凭借其在公益领域的持续深耕与创新实践
2026-02-10 16:22:00
中国消费者报重庆讯(记者刘文新)2月6日,重庆举行低空经济重大成果发布会,发布《重庆市低空装备产业链产品名录》(2025版)
2026-02-10 16:03:00