• 我的订阅
  • 科技

豆包“王炸”:字节跳动一天发布两款视频生成大模型

类别:科技 发布时间:2024-09-24 18:15:00 来源:新浪财经

字节跳动正式宣告进军AI视频生成。9月24日,字节跳动旗下火山引擎在深圳举办AI创新巡展,一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型,面向企业市场开启邀测。

活动现场展示的视频生成效果令人惊叹。无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。

火山引擎总裁谭待表示,“视频生成有很多难关亟待突破。豆包两款模型会持续演进,在解决关键问题上探索更多可能性,加速拓展AI视频的创作空间和应用落地。”

豆包“王炸”:字节跳动一天发布两款视频生成大模型

图:火山引擎总裁谭待发布豆包视频生成模型

创新技术,破解多主体互动和一致性难题

此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。

据火山引擎介绍,豆包视频生成模型基于 DiT 架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。全新设计的扩散模型训练方法更是攻克了多镜头切换的一致性难题,在镜头切换时可同时保持主体、风格、氛围的一致性,这也是豆包视频生成模型独树一帜的技术创新。

经过剪映、即梦AI等业务场景打磨和持续迭代,豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。深度优化的Transformer结构,则大幅提升了豆包视频生成的泛化能力,支持3D动画、2D动画、国画、黑白、厚涂等多种风格,适配电影、电视、电脑、手机等各种设备的比例,不仅适用于电商营销、动画教育、城市文旅、微剧本等企业场景,也能为专业创作者和艺术家们提供创作辅助。

目前,新款豆包视频生成模型正在即梦AI内测版小范围测试,未来将逐步开放给所有用户。剪映和即梦AI市场负责人陈欣然认为,AI能够和创作者深度互动,共同创作,带来很多惊喜和启发,即梦AI希望成为用户最亲密和有智慧的创作伙伴。

豆包大模型推出业界最高并发流量标准

此次活动中,豆包大模型不仅新增视频生成模型,还发布了豆包音乐模型和同声传译模型,已全面覆盖语言、语音、图像、视频等全模态,全方位满足不同行业和领域的业务场景需求。

在产品能力日益完善的同时,豆包大模型的使用量也在极速增长。据火山引擎披露,截至9月,豆包语言模型的日均tokens使用量超过1.3万亿,相比5月首次发布时猛增十倍,多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

此前,豆包大模型公布低于行业99%的定价,引领国内大模型开启降价潮。谭待认为,大模型价格已不再是阻碍创新的门槛,随着企业大规模应用,大模型支持更大的并发流量正在成为行业发展的关键因素。

据谭待介绍,业内多家大模型目前最高仅支持300K甚至100K的TPM(每分钟token数),难以承载企业生产环境流量。例如某科研机构的文献翻译场景,TPM峰值为360K,某汽车智能座舱的TPM峰值为420K,某AI教育公司的TPM峰值更是达到630K。为此,豆包大模型默认支持800K的初始TPM,远超行业平均水平,客户还可根据需求灵活扩容。

“在我们努力下,大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能,卷更好的模型能力和服务。”谭待表示。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-24 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

终于拿到内测!豆包-PixelDance真是字节视频生成大杀器
...头拉近,岩浆正在火山口跳动冒出。这段 10 秒的视频是豆包视频生成模型基于以上提示词想象创造的。可以说这段视频的拟真度非常高,并且有着娴熟的运镜,足以放入任何影视作品中。有着
2024-09-30 09:51:00
火山引擎丢出视频大模型「王炸」,云厂商从「价格战」回归「卷性能」
...下火山引擎在深圳举办 AI 创新巡展,一举发布了包括「豆包视频生成大模型」「音乐生成大模型」在内的多款模型。在此之前,海内外不少现象级的同类模型产品相继发布,包括字节跳动相继
2024-09-26 13:33:00
豆包再降价,字节“饱和式”进攻仍在继续
...然激烈。12月18日的火山引擎Force冬季大会上,字节跳动“豆包全家桶”又迎来了新成员。豆包视觉理解模型正式亮相,其具备更强的内容识别、理解和推理、视觉描述等能力;明年1月
2024-12-20 09:25:00
字节跳动旗下AI助手豆包推出视频生成内测,可将信息转化为视频内容
字节跳动旗下大模型AI助手豆包正式推出视频生成内测,意味着继快手、商汤、Minimax等公司后,字节跳动正式杀入AI视频生成领域。豆包官网称,豆包视频生成,支持图片文字一键成片,
2024-11-07 16:35:00
Sora概念盘中拉升,字节跳动或将与OpenAI短兵相接
...4日,字节跳动旗下火山引擎在深圳举办AI创新巡展,发布豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型
2024-09-26 09:17:00
AI视频新战场:字节对决快手、反击Sora
...起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧维 编辑丨蕨影一场由Sora
2024-09-30 13:34:00
视觉理解、3D生成,豆包这次又玩出了什么新花样?
...初创公司带着自家模型的新进展试图刷个脸熟。所以呢,豆包又又又更新了。(图源:雷科技)而且啊,这次还不是之前那每半个月发条站内信息告诉你的「小功能」更新,12月18日,字节跳动
2024-12-18 22:49:00
字节发布豆包1.5深度思考模型:“实拍级”图像生成
...,字节跳动旗下火山引擎总裁谭待正式发布了备受瞩目的豆包1.5深度思考模型。谭待指出,豆包1.5深度思考模型在多个关键领域展现出卓越性能。在数学、编程、科学推理这类专业领域中,
2025-04-17 11:54:00
豆包大模型将发布视频生成模型,带来更多模型家族的能力升级
9月18日消息,字节跳动今日宣布,豆包大模型将于9月24日发布视频生成模型,并带来更多模型家族的能力升级。9月24日14:30,2024火山引擎AI创新巡展・深圳站将于深圳举行,
2024-09-19 05:44:00
更多关于科技的资讯:
AI竞技场,河南加速度!
大河网讯 在2025世界人形机器人运动会上,“行者二号”在1500米项目中勇夺小组第一;内乡县牧原肉食产业综合体通过24小时巡检机器人与AI算法
2025-09-05 19:46:00
河北新闻网讯(王杨、曹莹莹)河钢集团张宣科技聚焦“近零碳排”冶炼全流程,通过持续优化生产工艺,充分释放设备效能。近日,该公司成功开发的高品质汽车用材料
2025-09-05 18:00:00
Baseus倍思强强联合Bose发布三大年度旗舰新品,高端专业音频迈入全民化时代
2025 年 9 月 5 日 14:00,全球新生活移动数码品牌 Baseus倍思举办线上新品发布会, 正式发布其年度旗舰音频新品——倍思 Inspire系列
2025-09-05 18:31:00
引领健康储鲜,澳柯玛风冷变频冷柜斩获“云鼎奖”
鲁网9月5日讯近日,奥维云网2025数字生态大会在杭州闭幕。作为家电行业极具影响力的年度盛会,现场汇聚了众多家电领军品牌
2025-09-05 13:38:00
周黑鸭携四大产品线矩阵破局全场景消费,构建卤味行业新范式
齐鲁晚报·齐鲁壹点 记者 张召旭在近期举办的行业展会上,周黑鸭凭借前瞻性战略布局引发行业广泛关注——品牌首次系统推出针对多元消费需求与渠道特性开发的四大产品线
2025-09-05 11:00:00
当“保温杯里泡枸杞”从段子变成日常,当“中药房下午茶”取代美式咖啡成为年轻人新宠,老字号品牌们逐渐发现:年轻人不是在买一杯饮料
2025-09-05 11:02:00
本报记者 魏 静 □ 忽 艳在国内鼓励创新、倡导在世界舞台展示中国实力产品与个人实力的大环境下,越来越多中国品牌凭借创新精神与卓越品质
2025-09-05 11:02:00
近日,阳光人寿秦皇岛中支在益寿园开展“银发课堂”特色活动,为老年群体送上内容丰富的金融知识。活动现场,工作人员通过生动的案例
2025-09-05 09:36:00
36氪首发|掘金“微醺”社交经济,精酿品牌「TAGSIU」获近千万 Pre-A 轮融资
作者 | 李小霞36 氪获悉,精酿品牌「TAGSIU 醍宿酿造」(下称“TAGSIU”)已完成近千万 Pre-A轮融资
2025-09-04 22:09:00
从形态突破到生态跃迁:华为三折叠的「鸿蒙时刻」
三折叠这个赛道,或许只有华为能够超越华为。华为Mate XT 非凡大师发布一年之后,三折叠这片“无人区”,仍然只有华为的身影
2025-09-05 00:13:00
大众网记者 张田夏荫 实习记者 张智尧 报道海信集团总裁、海信视像科技股份有限公司董事长于芝涛正式以大赛形象大使与推介大使的身份
2025-09-04 10:04:00
第26届GOPS全球运维大会落幕,AI Infra赋能运维转型
2025年6月28日,为期两天的第26届GOPS全球运维大会暨研运数智化技术峰会在北京市圆满落幕。作为国内首个运维行业盛会
2025-09-04 11:33:00
三联家电“伙拼9.12”权益全解析!三重补贴省心省钱嗨购金秋
鲁网9月4日讯金秋家装季撞上三联家电第十一季“伙拼9.12”大型内购福利会!这场被万千家庭期待的消费盛宴即将引爆全城!多重补贴
2025-09-04 11:33:00
灵动集团旗下欢米粒心理:新学期,为青少年心理护航——以专业体系构建成长防护网
在青少年心理健康服务需求进入 “刚性增长期” 的当下,资质与专业双轮驱动成为行业发展的核心支撑。灵动生活集团作为《互联网心理服务・心理测评服务通用规范》国家标准制定委员单位
2025-09-04 11:55:00
金秀之光,宏瑶传承千年瑶浴的现代创新之路
金秀大瑶山的采药人每日清晨踏遍青山,采集当地草药。这些草药通过广西宏瑶生物科技股份有限公司(以下简称“宏瑶股份”)的现代研发与技术加工
2025-09-04 11:55:00