• 我的订阅
  • 科技

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

类别:科技 发布时间:2024-09-26 13:45:00 来源:机器之心Pro

我们用17个Prompt,实测了一把字节的两大视频生成模型。

字节憋了个大招。

9 月 24 日,字节跳动旗下的火山引擎在深圳办了一场 AI 创新巡展,一口气发布了两款视频生成大模型,正式宣告进军 AI 视频生成。

这两款模型,一个名为 PixelDance(以下简称 P 模型),一个名为 Seaweed(以下简称 S 模型),不仅在审美、动幅上提升了一个 level,还破解了多主体互动和一致性难题。

话不多说,先整几个视频让大家感受下:

一位年轻女生微簇眉头,生气地戴上一副墨镜,这时,男主角入画,紧紧抱住了她。

这段 10 秒的镜头中,人物面部表情变化自然,没有任何虚化崩坏。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

再如,一只金毛小狗在草地上追逐泡泡。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

以及一个 3D 风格的可爱小女孩正在跳舞。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

看来,字节这次是把攒了许久的绝活儿,一股脑全倒出来了。

目前,新款豆包视频生成模型正在即梦 AI 内测版小范围测试,未来将逐步开放给所有用户。

我们也在第一时间拿到内测资格,接下来,就奉上新鲜出炉的一手实测。

解锁多动作、多主体

目前,市面上大部分视频生成模型,只能完成简单指令或者单一动作。而这次,豆包视频生成模型一顿升级,不仅可以遵循复杂 Prompt,还能捕捉多动作序列和主体互动。

例如,梵高站在自己的画作前,捂嘴大笑起来,脸上的褶子都清晰可见;随即又秒变严肃,手缓缓落下,捋捋自己的小胡子。

整套动作行云流水,表情自然逼真。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

再比如,我们输入 Prompt:两名宇航员行走在夜晚繁华的街道上。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

两名身穿宇航服的航天员,一前一后漫步在繁华街道上,身后人来人往,两侧的建筑亮起了绚丽的灯光和店招。

众所周知,AI 最容易犯的毛病之一,就是左右腿不分,或者惊现四条腿。

而在豆包视频模型中,二人走路姿势正常,几乎与真人无异,没有模糊、扭曲,也没有出现各种诡异画面。

我们还输入了一段形容词贼多的 Prompt:一只蜗牛在雨后的森林地面上缓缓爬行,它身后留下一条闪闪发光的粘液轨迹。蜗牛的触角谨慎地移动着,它的壳的每一段都有精细的纹理。一个摄像机跟踪着蜗牛的缓慢旅程。镜头非常接近,以至于蜗牛壳和身体上的水滴清晰可见,地面的细节也展现得非常清楚。

我们还试了下图生视频,上传图片后,输入 Prompt:金鱼游动,水中冒着气泡。

别看这个 Prompt 简单, 豆包模型的「脑回路」却复杂得很。不仅完美遵循文字指令,还学会了摇镜头。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

画面一开始,水缸中的金鱼开始游动,并伴随着大量气泡。随后,镜头一拉,现出女孩全身,她在水中缓缓转过身,发丝和宽松的衣摆在水中的漂浮感,以及头顶露出水面的状态,豆包模型均捕捉到位。

此外,豆包视频模型还采用全新设计的扩散模型训练方法,成功攻克了多镜头切换时难以保持一致性的困扰,可 10 秒讲述一个起承转合的故事。

比如,用它生成一段睡美人的故事。

字节版Sora终于来了!一口气两款视频模型,带来的震撼不只一点点

视频链接:https://mp.weixin.qq.com/s/FlyrUWhePcWhfhNuh7tplA

睡美人躺在床上陷入沉睡,窗外的小鸟叽叽喳喳也吵不醒她,这时一位王子俯下身吻了睡美人,试图唤醒她。

在这个 prompt 中,涉及多个镜头的切换,但主体、风格、氛围和逻辑仍能保持一致性。

审美高级,风格多变

豆包新模型采用深度优化的 Transformer 结构,大幅提升了视频生成的泛化能力,黑白、3D 动画、2D 动画、国画、厚涂等多种风格,它通通支持。

再来个动画风格的。

身穿灰色时尚卫衣的猫咪,迈着「六亲不认」的步伐,走在星光闪耀的 T 台上。

其中,猫咪眨巴着眼睛,毛发和衣服褶皱处理得也相当逼真,胸前的两根衣带也能随着步伐而摆动。

大家觉得豆包视频生成模型水平咋样呢?来评论区聊聊吧。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-26 14:45:10

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...豆包-Seaweed,参阅机器之心报道《字节版 Sora 终于来了!一口气两款视频模型,带来的震撼不只一点点》中带「即梦 AI」水印的视频
2024-09-30 09:51:00
字节版Sora火爆24小时,同名论文再次被热议
...ra了”。‍字节版Sora终于来了,这一次还憋了个大的——一口气推出Seaweed和PixelDance两款豆包视频模型
2024-09-26 13:41:00
在港投资AI 张一鸣的新副本
...业。2021年扩充到13个职业。而5月16日的这次人才扩招,则一口气扩充至51个职业,其中就包括人工智能、云端基础设施、软件、创新及科技、数据科学、网络安全这些方面的专家。
2023-06-08 17:46:00
B站AI课几秒出总结,划词就给解释,这个「AI学习搭子」真香
...动给云雀大模型也改了个名,统一叫「豆包」大模型,还一口气发布了 9 个大模型产品,涵盖通用模型、角色扮演、语音识别、文生图等多个领域。不过,功能再花哨,不好用也没人买账。毕竟
2024-07-27 09:29:00
大厂加码落地大模型,京东云一口气发了10个AI应用
...nchmark。" 京东云新发布的AI应用,图片由公司提供为什么一口气发这么多AI产品,京东云言犀相关人士的回答是:"电商需要的是一整套的系统的AI应用,而不是某一款提供单
2024-12-07 09:55:00
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
文 | 周鑫雨编辑 | 苏建勋2023年4月,成立于纽约的Runway AI发布了一段用AI生成的视频:模糊卡顿、物体扭曲
2024-02-18 06:20:00
30多款大模型亮相,现阶段厂商比客户更需要大模型
...|Koko,编辑|南四如果不是在WAIC展会上,你很难有机会一口气见到这么多AI大模型。7月6日至8日,WAIC2023在上海举办
2023-07-12 22:00:00
AI视频新战场:字节对决快手、反击Sora
字节跳动以性价比策略切入市场,掀起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧
2024-09-30 13:34:00
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...布自家新款AI多模态系列大模型,名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成,甚至直接吐露一个小目标
2024-12-05 09:45:00
更多关于科技的资讯:
近年来,音效设计行业在技术介入程度上的讨论不断增加。机器学习、区块链等技术的应用,使行业内部出现了关于“声音设计是否需要标准化
2026-01-09 14:49:00
“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛作品火爆征集中,入围即享孵化赋能!
鲁网1月9日讯在黄海之滨、崂山脚下,千年文脉与现代潮流在此交融共生。为推动中华优秀传统文化创造性转化、创新性发展,助力崂山文旅高质量发展提质增效
2026-01-09 16:45:00
安徽人文讲坛丨人工智能:向新、向深、向未来
大皖新闻讯 人工智能正以前所未有的速度重塑人类社会,成为驱动全球科技革命、产业变革与国家竞争的核心力量。从历史纵深审视
2026-01-11 17:59:00
“返本还原第四回——小尺幅版画作品展”在省美术馆展出
江南时报讯(记者 钱海盈)由江苏省美术馆主办、江苏版画院(水印版画材料与技术研究文化和旅游部重点实验室)承办的“返本还原第四回——小尺幅版画作品展”正在江苏省美术馆展出
2026-01-11 15:13:00
邦德激光SK高速款激光切管机,引领高效切割技术新高度
在金属管材加工中,如何让设备在真正“高速”运行时,仍能保持“高精度”与“高稳定性”?单纯提升单项参数往往顾此失彼。邦德激光认为
2026-01-11 15:47:00
OPC“最强大脑”集结 高德空间智能开发者大赛全国总决赛在苏州落幕
江南时报讯 “‘智能遛狗小助手’帮你制定更合理的遛狗计划。”“出门旅游,帮你一站式行程管理。”“无障碍出行,AI轻松识别障碍物
2026-01-11 16:26:00
合肥创新院举办“汽车+”产业科创企业路演
大皖新闻讯 为搭建产业与资本的高效对接桥梁,推动汽车科技创新成果转化,助力创新创业企业成长,近日,2026“汽车+”产业科创企业新年路演在合肥创新院举办
2026-01-11 16:52:00
在吉林,机器人也开始“卷”滑雪了!
当双足机器人蹒跚滑下雪道,当机械臂在-20℃寒风中精准投出雪球……这些充满未来感的画面,如今正在吉林的冰天雪地里真实上演
2026-01-11 15:05:00
中新经纬1月11日电 国家医保局网站11日发布《国家医疗保障局办公室关于开展个人医保云建设试点申报工作的通知》(以下简称《通知》
2026-01-11 12:46:00
都市快报讯 昨天上午,上城区同协路旁的西子智慧产业园迎来了一名特殊的“保安”——身高1.8米,通体银色金属光泽,走起路来
2026-01-11 08:22:00
人形机器人“入职”前的试炼场来了杭州日报讯 核心提示2025年被称为人形机器人量产元年,今年人形机器人步入量产关键期,如何让机器人理解并适应人类真实的世界
2026-01-11 08:22:00
河北新闻网讯(崔梦露)1月8日下午,平安产险唐山中心支公司通过抖音、微信视频号、平安好车主、平安好生活等四大线上平台,举办“开年迎好运家家有平安”直播活动
2026-01-09 21:11:00
在全球制造业向高质量升级的浪潮下,超高压技术正成为破解多行业性能瓶颈的关键支撑。作为全球超高压领域标杆企业,Quintus专注于超高压技术的研发与应用
2026-01-10 20:59:00
为规范互联网应用程序个人信息收集使用活动,保护个人信息权益,促进个人信息合理利用,根据《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《网络数据安全管理条例》等法律法规
2026-01-10 21:56:00
浙江造,红遍中国年!万事利春晚红围巾成“新年硬通货”
随着2026马年临近,一条承载马年春晚吉祥寓意的红围巾,正成为年末备受瞩目的新春佳礼。作为总台文创官方合作品牌,万事利丝绸匠心推出的“骐骥驰骋”系列围巾与丝巾
2026-01-10 21:02:00