• 我的订阅
  • 科技

通义千问App也“EMO”啦! 一段音频就能驱动照片唱歌

类别:科技 发布时间:2024-04-30 06:34:00 来源:每日看点快看

本文转自:每日商报

商报讯(记者 王彬彬)近日,又一款AI模型EMO上线通义千问App。输入一段音频、一张照片,就能让图中人物开口唱歌说话,让奥黛丽赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。这是继现象级应用“全民舞王”在社交平台掀起“兵马俑跳科目三”“金毛跳舞”热潮后,通义千问解锁的又一种AI模型新玩法。

用户打开通义千问App,进入“全民舞台”频道,就可来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板,上传肖像照片,EMO随即就能合成视频。首批上线了80多个EMO模板,包括热门歌曲《上春山》《野狼disco》等,网络热梗“钵钵鸡”“回手掏”等。目前通义App暂不开放用户自定义音频,用户只能选择App预置的音频来生成视频。

记者体验过后发现,最终生成的唱歌视频中,原本图片里的人物不仅能准确地对上歌词的口型,连面部表情和眼神也十分的自然。需要提醒的是,用户上传的照片需要确保已获得权利人的同意,除用于AIGC服务外,不得用于其他用途,避免对他人隐私及版权构成侵权。

据了解,EMO与“全民舞王”背后的模型Animate Anyone均出自通义实验室,2月底,阿里通义实验室的一篇论文让EMO火遍海内外,成为继SORA之后最受关注的AI模型之一,模型的产品化进程也广受关注。

EMO背后的肖像说话(Talking Head)技术是当前大热的AIGC领域。EMO之前的Talking Head技术都需针对人脸、人头或者身体部分做3D建模,通义实验室在业界率先提出了弱控制设计,无需建模就可驱动肖像开口说话,不仅降低视频生成成本,还大幅提升了视频生成质量。EMO学习并编码了人类表达情绪的能力,能将音频内容和人物的表情、嘴型匹配,还能把音频的语气特征和情绪色彩反映到人物微表情上。

如今,EMO通过通义千问App开放给所有用户免费使用,未来,EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。不仅如此,近期,通义App还陆续推出了超长文档解析、AI编码助手、AI会议助手等免费使用功能,通义大模型正在成为越来越多用户的超级AI助手。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-30 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

MediaTek携手阿里云在天玑移动平台完成通义千问大模型端侧部署
...与阿里云达成深度合作,双方在天玑9300移动平台上完成通义千问大模型小尺寸版本的端侧部署,该部署可适配天玑8300移动平台,可实现离线状态下即时且精准的多轮人机对话问答。未来
2024-03-28 15:35:00
阿里Q3财报:核心业务收获稳健增长,“AI驱动”潜力初现
...等场景化应用。季度内,阿里云发布业界最强开源大模型通义千问Qwen-72B。淘宝天猫、阿里国际数字商业发布了多款AI工具辅助商家经营提效,加速推进AI电商场景落地。钉钉、夸克
2024-02-07 22:43:00
本文转自:新华网12月1日,阿里云通义千问720亿参数模型Qwen-72B宣布开源。该模型基于3T tokens高质量数据训练
2023-12-01 13:33:00
阿里云CTO周靖人:全面投入升级AI大基建
...每个AI和应用提供高性能、高效的算力服务。大会现场,通义大模型迎来了年度重磅发布,基础模型升级,性能媲美GPT-4o,发布最强开源模型Qwen2.5系列,同时上架语言、音频、
2024-09-19 15:53:00
阿里云正式发布“通义听悟” 首款面向消费者端产品
【CNMO新闻】阿里云智能于6月1日发布通义听悟,并面向公众开放公测。阿里云智能CTO周靖人表示,通义听悟是依托通义千问大模型和音视频AI模型的AI助手,可进行实时语音识别,实现
2023-06-07 17:27:00
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
时隔一个月,通义千问又放大招了!在一个月前的阿里云栖大会上,阿里正式发布通义千问2.0版本,在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上,都有较大提升。并且,阿
2023-12-01 21:07:00
大模型下探音视频AI市场,战争才刚刚开始 | ToB产业观察
...之后,还有更多仍在“来的路上”。6月1日,阿里云宣布通义大模型进展,聚焦音视频AI的“通义听悟”正式亮相,成为国内首个开放公测的大模型应用产品。通义听悟其前身是早在2021年
2023-06-07 14:00:00
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
通义大模型发布一周年之际,迎来重要的历史性时刻。5月9日,阿里云正式发布通义千问2.5,模型性能全面赶超GPT-4 Turbo
2024-05-09 12:00:00
阿里通义上新:AI终于能做真正的PPT了!还免费
...模型工具的日常中,诶嘿,最近还真又挖到了新神器——通义直接在网页版里上新了“效率”版块,功能很直给:实时记录、阅读助手,还有PPT创作。其中,PPT创作属于是新鲜出炉。简单来
2024-09-02 06:05:00
更多关于科技的资讯: