• 我的订阅
  • 科技

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

类别:科技 发布时间:2024-04-09 14:00:00 来源:砍柴网

在 AIGC 技术的推动下,视频生成模型领域正迎来创新的高潮。出门问问独立研发的数字人克隆及生成服务,以其领先的创新能力,提供了高度真实与生动的数字体验,吸引了众多用户的目光。目前,这一先进技术已经成功部署在出门问问的 AIGC 产品——「奇妙元」和「奇妙问」中,持续扩大其在行业内的影响力和用户基础。

出门问问数字人系统持续迭代

自出门问问启动数字人服务以来,其技术团队已经多次进行数字人系统的迭代更新。如今的第四代数字人系统——基于多尺度3D模型的WetaAvatar 4.0,通过整合「序列猴子」的强大文案生成能力以及「魔音工坊」的高质量语音合成技术,我们进一步强化了数字人的呈现效果,实现高度仿真的外观,同时还精心打造了生动的表情,媲美真人。

综合来看,在WetaAvatar 4.0中,不论是数字人进行讲话、唱歌或者静音状态,其表现均优于前代,技术指标Sync-C的数值普遍高于WetaAvatar 3.0,清晰度也相比上代有较大提升。

Sync-C (SyncNet Confidence):使用预训练的衡量音画同步性的模型 SyncNet 计算的音画同步置信度。相同的驱动音频和驱动视频,数值越高越好。

TTS引擎MeetVoice Pro赋能数字人

在第四代数字人系统WetaAvatar 4.0中,用户提交文本后,系统将调用出门问问的TTS引擎MeetVoice Pro,该引擎基于大语言模型—「序列猴子」,支持产生清晰自然的语音输出。随后,这段语音被输入数字人系统,确保视频中的数字人物可以以精准的口型匹配、自然的面部表情及流畅的身体动作呈现。通过这种方式,我们将文本信息转化为一个高度真实的数字化视频,为用户提供视觉与听觉相结合的真实体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

实时语音解析能力— 本技术能够即时准确地从语音音频中提取信息,并转换成可操控虚拟形象的音频信号。

精确的口型驱动能力 — 采用深度学习模型,将音频信号精准地转化为自然流畅的口型及面部动作,提供真实的视听体验。

领先的音频编辑能力 — 本系统整合了魔音工坊配音的核心功能,包含快速准确地调整多音字和韵律,以确保配音的专业水准,特别适合虚拟主持人等应用场合。

三大核心特色 打造超真实数字人体验

WetaAvatar 4.0采用了一套先进的人脸重建与生成机制。首先,通过人脸重建模型捕捉到人脸的核心特征数据,这一数据反映了人脸的不变属性。然后,人脸生成模型使用这些基础数据,并结合具体的人脸图像及配套的音频信息进行处理,以此同步创造出与音频匹配的嘴型动作和表情。这项技术的应用确保了数字人的表现不仅仅是视觉上的逼真,还能在语音和表情的同步上达到极高的自然度,大幅提升了数字人的真实感。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

全新升级后的第四代数字人系统具有“精致外观”、“迅捷响应”、和“多样选择”三大核心特色。

精致外观

利用最新数字人系统WetaAvatar 4.0,出门问问的数字人实现了前所未有的逼真还原。目前,数字人不仅拥有极大的真实感,嘴形与声音的同步精度也不断突破,带来了动态上的全新提升——让数字人的每一个微笑、每一次皱眉都宛若真人。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

迅捷响应

最新数字人系统WetaAvatar 4.0基于强化的底层架构,极大提升了合成速度并显著降低了延迟。在普通消费级显卡上,系统能以0.3的实时率合成视频(即1分钟的视频仅需20秒左右)。同时,实时驱动延迟被控制在1秒内,大幅减少用户等待时间,实现流畅无缝的迅捷体验。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

多样选择

出门问问倾力打造,旨在拓展数字人的多样性:从融合多音色、多语种的声音,到整合不同年龄和性别的人物形象,再到多角度、多动作的灵活展示,这一全新升级的数字人系统实现了质的飞跃,极大降低了数据集成的复杂度,为创建丰富多彩的数字世界提供了无限可能。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

三大技术指标 多方面综合提升性能

WetaAvatar 4.0系统的最新升级实现了多维度的重大突破,推动行业标准再上新高。本次升级的全面性能,可通过以下三个关键技术指标以及相应的demo展示进行深入评估与体验:

FID (Fréchet Inception Distance)

使用预训练的图像分类模型 Inception v3 网络抽取图像特征,假设特征向量的分布为高斯分布,计算真实图片序列和生成图片序列两个高斯分布的均值和协方差矩阵。通过测量两个概率分布之间的“距离”(相似程度)来评估生成图像序列与真实图像序列的相似程度。数值越低越好。

SSIM(Structural Similarity Index)

SSIM全称为结构相似性指数,是一种用于衡量两幅图像相似度的指标。它是一种全参考的指标,即它需要一张原始的图像作为参考。SSIM将图像的亮度、对比度和结构等因素考虑在内,通过比较这些因素的相似性来计算两幅图像之间的相似度。数值越高越好。

PSNR(Peak Signal-to-Noise Ratio)

PSNR全称为峰值信噪比,是一种常用于衡量图像或音频质量的指标。它是通过比较原始信号与经过压缩或处理后的信号之间的信噪比来评估质量的。数值越高越好。

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

根据综合指标测算和数据对比分析,得出结论:WetaAvatar 4.0在关键性能参数上相较于其前代系统取得了实质性进展。具体而言,在图像的真实感呈现、角色相似度的精确匹配,以及视频输出质量上,均体现出明显提升。

打造出更加人性化、情感丰富的数字伴侣

出门问问的技术团队持续探索创新,不仅将这一全套技术精益求精,更确保其在行业中处于领先地位,带给ToC和ToB客户前所未有的高质量数字人使用体验,速度与效果兼备。

出门问问AIGC产品——「奇妙元」与「奇妙问」现已全面集成我们最新一代的数字人系统。截至目前,「奇妙元」与「奇妙问」已上线超过200种数字人形象,并且我们正致力于对这些形象进行持续的优化迭代,以提供更优质的数字化体验。

出门问问的自研大模型「序列猴子」,其以语言为核心的能力体系,涵盖“知识、对话、数学、逻辑、推理、规划”六个维度。凭借「序列猴子」在跨模态迁移方面的出众表现,出门问问的技术团队推出了MeetVoice Pro语音大模型。此外,我们团队也计划利用「序列猴子」的核心能力,打造多模态数字人模型,进一步拓展和强化数字人的能力范围。

面向未来,出门问问将继续秉承深耕数字人技术的理念,逐步将其应用到更广泛的产品服务中。我们的目标是利用先进的智能技术,为用户打造出更加人性化、情感丰富的数字伴侣,可全天候提供陪伴。这将使人机互动变得更为自然,并将AI融入每个人的日常生活,引领智慧生活的新潮。

用户福利来袭

出门问问重磅发布全新2.5D数字人系统 WetaAvatar 4.0

注册「奇妙元」后,

点击我的 - CDK兑换码,

输入兑换码:AIGC2024,

免费获得数字人合成时长。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-09 14:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

柯尼卡美能达重磅亮相德鲁巴
...见未来印刷的无限潜能SeethePotentialintheFutureofPrint”为主题重磅亮相本届德鲁巴,2400平方米的展位上不仅展示了先进的端到端智能工厂数字化生产线
2024-06-04 09:07:00
浪潮海岳软件重磅升级,“软件+AI”助力全场景数字化
...名城提档升级、实施高端软件铸魂工程的重要举措。会上重磅发布新一代浪潮海岳PaaS平台iGIX、企业服务大模型inGPT,成立低代码开源软件生态联盟和济南软件产业联盟。软件是数
2023-09-08 17:05:00
三箭齐发 西湖论剑重磅成果助力打造安全新质生产力
...安全变革”“安全运营智能化、实战化”三大核心议题,重磅发布《企业数据资源入表实践白皮书》《重大活动网络安全保障建设及运营指南》和AI安全八大应用趋势等一系列成果
2024-05-24 14:16:00
2023上海车展正式开幕,多款重磅新车亮相
4月18日,2023上海车展正式开幕,多款重磅新车亮相,让人眼花缭乱。宝马集团电动车齐聚上海车展,宝马、MINI、劳斯莱斯三大品牌发力。在本次车展上,宝马将首发五款新能源车型、三
2023-04-18 12:36:00
...生态,共商筑牢“数字安全屏障”的创新方案。本届大会重磅发布“网络内生安全试验场NEST2.0”等3项创新成果及两份前瞻性白皮书,并深度融合虚拟现实、人工智能等高新技术,搭建沉
2023-01-13 06:05:00
ETAP全新数字孪生平台:“盘活”未来电网价值链的创新路径
...是在这一需求背景下,施耐德电气在2023年创新峰会上,重磅发布了ETAP全新电气系统数字孪生平台。这一平台将能源管理和工程解决方案的全球领导者ETAP与ALPI
2023-07-07 16:00:00
AI数智新引擎丨安道教育携重磅教装产品亮相第85届教装展
...道教育以“AI数智新引擎,开启教育新态势”为主题,携重磅教育装备产品和服务亮相。在AI大数据的推动下,教装行业正迎变革机遇。如何利用AI更好地赋能教育?在这场展示会上,安道给
2025-05-06 17:45:00
全新普拉多领衔、X3在列,2024值得看的6款重磅合资SUV
转眼间,2023年即将结束,2024年已在路上。今年一年,汽车市场照样是精彩纷呈,新车层出不穷,可以说是“你方唱罢我登场”。放眼2024年,也将有多款新车登场,比如在合资SUV市
2024-01-02 09:47:00
凌云光•元客视界携全新XR+VP架构亮相上海VPS&DHDC 2023
...会同期,元客视界携全新XR+VP架构和智能数字人应用技术重磅亮相。UE5.2+Rivermax2110 全新XR+VP架构打造超高清虚拟制作新高度从绿幕抠像到虚拟影棚
2023-06-25 13:00:00
更多关于科技的资讯:
胶东在线3月5日讯(通讯员常蕊徐冰鑫)近日,山东移动蓬莱分公司(以下简称“蓬莱移动”)成功助力烟台洛姆电子有限公司实现数智化升级
2026-03-08 03:03:00
300亿年误差不超过一秒!中国科大实现锶原子光晶格钟新突破
大皖新闻讯 3月7日,大皖新闻记者从中国科学技术大学获悉,近期该校潘建伟、戴汉宁、陈宇翱、彭承志等科研人员在光钟研制方面取得里程碑式进展
2026-03-07 17:23:00
3月6日消息,“晋e行”作为山西高速公路出行服务的“数字大脑”,自2022年正式上线以来,以数字赋能为核心,标准化运营为抓手
2026-03-07 18:15:00
2026雄安国际机器人大赛征集机器人领域新技术新产品新场景。
2026-03-07 18:40:00
中新经纬3月7日电 (谢婧雯)你下班了,站在公司楼下,掏出手机。以前打车,要打开打车软件、输入目的地、比价、选车型、确认呼叫
2026-03-07 18:52:00
春晚机器人表演带火租赁市场 厦门景区商超一机难求
东南网3月7日讯(海峡导报记者 孙春燕/文 陆军航/图)马年央视春晚,人形机器人的“赛博表演”惊艳全球,也带火了线下租赁市场
2026-03-07 14:21:00
【读图】回眸十四五,最感人至深的是…… 扫码阅读手机版
2026全国两会(策划 郁建锋、王聪 文案 董琳晶 设计 贾静、杜珊、张晓钰)
2026-03-07 14:56:00
大河网讯 一束微光照亮“智造”星系,璀璨的电子信息产业在郑州航空港拔节生长。在这里,产业星光汇聚成河,超千亿级集群汇聚了从芯片研发到整机组装的产业链
2026-03-07 16:14:00
全国人大代表刘庆峰:未来AI硬件会走进千家万户
大皖新闻讯 2026年是“十五五”开局之年,也是人工智能深度赋能千行百业的关键一年。正在召开的2026年全国两会上,人工智能毫无意外地成为代表委员们热议的高频词
2026-03-07 16:48:00
视频摄制:冯阳 霍艳恩 赵新宇 王思宁
2026-03-07 10:02:00
中国青年医师IP孵化计划在杭州启动
2026年3月5日,以“AI链全球 生态共生”为主题的中国青年医师IP孵化计划在杭州启动。本次活动来自全国多所医院的专家
2026-03-07 10:40:00
租金两块钱一分钟 “共享机器人”即将入驻杭州商场、电影院
星枢智能的“机器人家族” 记者 杨亦淇 摄一台售价20多万元的春晚同款人形机器人,现在花5000元就能租一天;如果是基础款
2026-03-07 08:05:00
摘要:随着信息技术的快速发展,人工智能技术逐渐渗透金融机构的各类业务与管理环节,对传统金融运作模式产生了深刻影响。金融机构在激烈竞争和成本约束的背景下
2026-03-07 05:46:00
近日,省应急管理厅举行“AI+工业企业火情预警(火眼哨兵)”“AI+烟花爆竹监管(烟花卫士)”应用上线发布仪式。浙江拥有30余万家工业企业
2026-03-07 07:34:00
视频摄制:张晶、赵新宇、朱泊宇
2026-03-07 07:47:00