• 我的订阅
  • 科技

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

类别:科技 发布时间:2025-02-07 18:15:00 来源:浅语科技

快科技2月7日消息,近期,抖音集团旗下图片视频工具即梦AI在官方社交媒体上发布了一条新功能上线预告片。

视频显示,新功能采用了全新的多模态视频生成模型OmniHuman,让用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。

对于人物视频生成中常见的手势崩坏,也相比现有方法取得了显著的改善。

此外,对动漫、3D卡通等非真人图片输入的支持效果也较为出色,生成的视频能保持特定风格和原有的运动模式。

根据技术主页展示的演示效果来看,OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用,字节跳动技术团队在主页中特别标注称,OmniHuman将不会对外提供下载。

即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。

由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整,并逐步开放。

该负责人同时表示,即梦还会对这一功能设置严格的安全审核机制,并且对输出的视频标注水印以作提醒,从而确保AI发挥正面、积极的作用,助力视频创作者更好地实现想象力的表达。

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

【本文结束】如需转载请务必注明出处:快科技

责任编辑:朝晖

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-07 20:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都
2024-09-13 13:34:00
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...兴科技、天娱数科、信雅达等跟涨。消息面上,9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance
2024-09-26 09:17:00
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...放入任何影视作品中。有着剪映、即梦等视频创作工具的字节跳动,正式宣告进军 AI 视频生成领域。那是在本周二,「2024 火山引擎 AI 创新巡展」来到了深圳。这一巡展上,字节
2024-09-30 09:51:00
Pika、阿里同日炫技!国产视频大模型奋起直追
...之外还包括三大图片转视频神器——阿里的Animate Anyone、字节跳动的Magic Animate、微软的GAIA
2024-03-01 09:26:00
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...个月发条站内信息告诉你的「小功能」更新,12月18日,字节跳动在上海举行了「火山引擎FORCE原动力大会·冬」,大会正式带来了豆包大模型家族的全面升级,并打造2000平方米的
2024-12-18 22:49:00
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...迎投稿或者联系报道。本文的作者主要来自于浙江大学和字节跳动。第一作者是浙江大学计算机学院的博士生叶振辉,导师为赵洲教授,主要研究方向是说话人视频合成,并在 NeurIPS、I
2024-11-01 09:27:00
8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入!字节跳动放大招?
...当今世界上最懂阿里大模型的人,但这个人现在跳槽到了字节跳动,对于阿里来说这无异于釜底抽薪。7月中旬,最先曝出来的消息是周畅即将辞职创业,然而10月底,他就已经加入了字节跳动。
2024-12-07 09:52:00
这周,5家公司发了AI新品 | 最前线
...出支持万卡训练的大模型训练云平台尚未推出自研模型的字节跳动,让火山引擎先在AI赛道上跑了起来。在4月18日举办的“原动力大会”上,火山引擎发布了自研DPU等系列云产品,并推出
2023-04-22 15:32:00
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...打开更多场景。自今年 2 月 Sora 面世以来,很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手
2024-09-26 13:33:00
更多关于科技的资讯:
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00
大河网讯 这一年,我们没有走遍世界,但世界,走进了《Global Talk》。2025年,《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事
2025-12-31 22:33:00
近日,上药控股山东总部携手浪潮智慧建筑,构建涵盖16大智能化系统的智慧园区体系,以智慧云平台为中枢推进全要素数字化升级
2025-12-31 22:59:00
石家庄二中新添“AI学伴”,有道AI答疑笔以“引导式答疑”助力启发式教学
河北新闻网讯 为推动教育资源均衡发展,让智能科技惠及更多青少年,12月18日,石家庄市“希望工程”事业发展中心、石家庄市青少年发展基金会联合网易有道
2025-12-31 17:18:00
中国消费者报福州讯(记者张文章)12月31日,福建省消费者权益保护委员会聚焦“科技+消费”核心场景发布消费提示,提醒广大消费者警惕伪智能陷阱
2025-12-31 17:33:00
中国消费者报海口讯(记者黄劼)2025年12月30日,三亚海旅免税城迎来开业五周年。海旅免税以“High Five 5•五周年狂欢庆典”为主题
2025-12-31 17:33:00
麦当劳中国第4400家LEED认证绿色餐厅落户福州
福州新华都大厦餐厅盛大开业,“开心书屋”全国首发麦当劳中国第4400家LEED认证绿色餐厅落户福州辞旧迎新之际,麦当劳中国第4400家LEED认证绿色餐厅“福州新华都大厦(五四路)餐厅”盛大开业
2025-12-31 17:49:00
“艾白”来了!12月31日,福州日报社首位机器人员工正式上岗!
2025-12-31 17:49:00
嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》
河北新闻网讯(记者 李春炜)12月31日,嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》,基于嘀嗒顺风车大数据和近万名嘀嗒顺风车用户调研
2025-12-31 18:04:00