• 我的订阅
  • 科技

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

类别:科技 发布时间:2025-02-07 18:15:00 来源:浅语科技

快科技2月7日消息,近期,抖音集团旗下图片视频工具即梦AI在官方社交媒体上发布了一条新功能上线预告片。

视频显示,新功能采用了全新的多模态视频生成模型OmniHuman,让用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。

对于人物视频生成中常见的手势崩坏,也相比现有方法取得了显著的改善。

此外,对动漫、3D卡通等非真人图片输入的支持效果也较为出色,生成的视频能保持特定风格和原有的运动模式。

根据技术主页展示的演示效果来看,OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用,字节跳动技术团队在主页中特别标注称,OmniHuman将不会对外提供下载。

即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。

由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整,并逐步开放。

该负责人同时表示,即梦还会对这一功能设置严格的安全审核机制,并且对输出的视频标注水印以作提醒,从而确保AI发挥正面、积极的作用,助力视频创作者更好地实现想象力的表达。

字节跳动放大招!OmniHuman数字人模型即将上线:一张图+一段音频即可生成视频

【本文结束】如需转载请务必注明出处:快科技

责任编辑:朝晖

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-07 20:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真的肖像视频,对声音中呼吸,叹气,挑眉等细节都
2024-09-13 13:34:00
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...兴科技、天娱数科、信雅达等跟涨。消息面上,9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance
2024-09-26 09:17:00
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...放入任何影视作品中。有着剪映、即梦等视频创作工具的字节跳动,正式宣告进军 AI 视频生成领域。那是在本周二,「2024 火山引擎 AI 创新巡展」来到了深圳。这一巡展上,字节
2024-09-30 09:51:00
Pika、阿里同日炫技!国产视频大模型奋起直追
...之外还包括三大图片转视频神器——阿里的Animate Anyone、字节跳动的Magic Animate、微软的GAIA
2024-03-01 09:26:00
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...个月发条站内信息告诉你的「小功能」更新,12月18日,字节跳动在上海举行了「火山引擎FORCE原动力大会·冬」,大会正式带来了豆包大模型家族的全面升级,并打造2000平方米的
2024-12-18 22:49:00
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型
...迎投稿或者联系报道。本文的作者主要来自于浙江大学和字节跳动。第一作者是浙江大学计算机学院的博士生叶振辉,导师为赵洲教授,主要研究方向是说话人视频合成,并在 NeurIPS、I
2024-11-01 09:27:00
8位数年薪!“最懂阿里大模型的人”带整个团队跳槽加入!字节跳动放大招?
...当今世界上最懂阿里大模型的人,但这个人现在跳槽到了字节跳动,对于阿里来说这无异于釜底抽薪。7月中旬,最先曝出来的消息是周畅即将辞职创业,然而10月底,他就已经加入了字节跳动。
2024-12-07 09:52:00
这周,5家公司发了AI新品 | 最前线
...出支持万卡训练的大模型训练云平台尚未推出自研模型的字节跳动,让火山引擎先在AI赛道上跑了起来。在4月18日举办的“原动力大会”上,火山引擎发布了自研DPU等系列云产品,并推出
2023-04-22 15:32:00
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...打开更多场景。自今年 2 月 Sora 面世以来,很多人都期待字节的动作。拥有抖音和剪映这两个最强的视频 App 在手
2024-09-26 13:33:00
更多关于科技的资讯:
年入558亿,中国便利店之王,竟然是它
提起便利店大家脑海中出现的第一个名字是什么?罗森、7-11还是全家,可能每个人的答案都不一样。但如果是广东的朋友,那么答案一定是#美宜佳
2025-08-03 05:41:00
运动品牌营销细分,潮流基因强化圈层认同|世研消费指数品牌榜Vol.56
本次监测周期内,安踏、耐克和斐乐以1.86、1.70、1.68的综合热度位列榜单综合热度前三。图源:世研大消费指数国货运动品牌场景痛点精准拆解
2025-08-03 05:41:00
最没存在感的河北特产,悄悄统治江浙沪?
提到河北衡水,估计不少人脑子里先冒出来的,是让全国学生闻风丧胆的衡水中学,以及一瓶名叫老白干的白酒。但在这两张耀眼名片外
2025-08-03 06:43:00
华立工业园:制造企业落脚海外的“工业唐人街”
过去一百多年来,唐人街是中国移民在海外聚居形成的经济和文化社区,往往也是新移民踏上陌生土地后落脚的第一站。对于许多刚刚“走出去”的中国制造企业
2025-08-03 06:43:00
对话蚂蚁集团张俊杰:AI 如何重塑医疗健康产业?
当大模型从技术奇点跃迁为产业基座,当智能体从实验室走进产线诊室,人工智能的第三次浪潮正以前所未有的锐度重构全球经济肌理
2025-08-03 06:45:00
让机器人拥有智能触觉,「悟通感控」获数千万元融资 | 36氪独家
36氪获悉,柔性触觉感知科技公司「悟通感控」近日完成数千万元系列融资:Pre-A轮由尚势资本领投、水木创投跟投;Pre-A+轮由广发基金瑞元资本领投
2025-08-03 06:45:00
打工人的终极难题:快乐和健康,我都想要
年轻人的「肠胃焦虑」新解法。撰文|J封面图源|《她的城》剧照在这个讲求效率与速度的时代,年轻人似乎比任何时候都更懂健康的重要
2025-08-03 06:45:00
这一次,普通人是主角
一只白鸽突然停在头上,会有什么样的故事发生?静静地等它飞走,留下羽毛扫过的温度。或者,赶快举起手机,记录下这珍贵的一刻
2025-08-03 06:45:00
破晓之光:2025 ChinaJoy AIGC大会圆满召开 | ChinaJoy2025
2025年8月1日,ChinaJoy AIGC大会在上海浦东嘉里大酒店三层上海宴会厅2召开。大会以“破晓之光”为主题,围统“AI基建与大模型重构的黎明之光”
2025-08-03 07:45:00
7月,在太仓大数据产业园,世纪智联科技发展(苏州)有限公司算力中心项目宛如一条腾跃的巨龙,在江苏银行21亿元绿色授信支持下
2025-08-03 05:14:00
2日,浙江大学脑机智能全国重点实验室发布最新成果,新一代神经拟态类脑计算机——“悟空”问世。这是国际首台神经元规模超20亿的基于专用神经拟态芯片的类脑计算机
2025-08-03 07:46:00
全国产智能体MasterAgent:一句话造专属AI团队,专业协同交付
MasterAgent坚持核心技术自主研发,确保从底层架构到上层应用的安全可靠如果说大语言模型让全世界看到了AI的潜力
2025-08-03 07:46:00
当一场国际音乐节落地,百威中国如何把握潮流密码?
情绪主导的消费时代里,啤酒行业正努力让每一代年轻人“上头”。情绪消费时代,一场音乐节仍然是年轻人的刚需11月,全球最大规模的电音音乐节Tomorrowland即将首次登陆中国
2025-08-03 07:47:00
用AI破局情境化学习,瓦拉英语发力在线英语教育
大模型时代来临之后,不少教育公司都在尝试使用AI生成课程内容,或利用AI生产高互动性、个性化内容,来提升教育的质量和效率
2025-08-03 07:47:00
在消费越来越多元化的今天,首发经济正成为城市经济发展的重要引擎和消费增长的活力源泉。从新商业综合体的落成,到品牌开设首店
2025-08-03 06:44:00