• 我的订阅
  • 科技

Sora炸圈后哑火,国产视频大模型接棒降门槛

类别:科技 发布时间:2024-09-12 09:57:00 来源:第一财经资讯

OpenAI旗下文生视频模型Sora推出时引发的行业爆炸仿佛还在昨日,但至今Sora也未对外正式开放使用。与之相对的是国内视频大模型在2024年密集发布,虽然技术更新不断,但成品多数仍需后期人工剪辑合成,影响技术在应用端的落地速度。

基于此,9月11日,生数科技披露功能更新,全球首发“主体参照”(Subject Consistency)功能,实现对任意主体的一致性生成,让视频生成更加稳定与可控。所谓“主体参照”,就是允许用户上传任意主体的一张图片,AI能够锁定该主体形象,通过描述词任意切换场景,输出主体一致的视频。

在生数科技CEO唐家渝看来,短视频、动画作品、广告片等影视作品,在叙事的艺术中均要求叙事体系“主体一致、场景一致、风格一致”,视频模型要达到叙事的完整性,就必须在这些核心元素上实现全面可控。

Sora炸圈后哑火,国产视频大模型接棒降门槛

一键生成32秒视频

生数科技上一次对外发声是在今年4月,清华大学人工智能研究院副院长、生数科技联合创始人兼首席科学家朱军教授发布了长时长、高一致性、高动态性视频大模型Vidu,可以一键生成长达16秒的视频。此次技术更新,Vidu视频最长可以生成32秒。

2024年,整个大模型赛道经过前一年的疯狂,逐渐冷静,视频大模型被视为迈向多模态大模型或AGI的必经之路。以快手、字节旗下抖音为代表的短视频公司,以阿里、腾讯为代表的互联网大厂,以生数科技、智谱AI、爱诗科技等为代表的创业公司,均先后发布视频大模型产品。

据德邦证券统计,自Sora发布以来,国内外已有十多家公司发布或更新视频生成模型。客观来看,国内外之间的差距正在逐步缩小,视频时长、分辨率等基础功能具有复制性,未来竞争或向抢占用户、提升黏性等方向迁移。从主观角度对比,德邦证券认为大模型生成的视频质量提升显著,但离物理世界模拟器仍有距离。文生视频领域视频画面普遍清晰,但在动作幅度与物理还原度方面差异较大。这也是此次生数进行功能升级的考虑之一。

唐家渝表示,目前Vidu生成时长32秒是一键端到端生成,不是拼接插帧生成的。不同之处在于模型对更长时间信息的压缩,包括信息表现的能力更强,这实际上更本质地与物理世界的理解和语义输入的关系相关。所以提高时长需要提升模型对世界的抽象理解能力、压缩能力、理解能力,包括生成能力。

创作了动画短片《夏日的礼物》AIGC艺术家石宇翔认为,目前行业目前对AI视频的包容度比较高,细节上可提升的地方比如对复杂镜头的处理、对多人物镜头的处理,以及一些带有场面调度的处理等。与基础的图生视频功能相比,“主体参照”功能摆脱了静态图片的束缚,提升创作连贯性,节约了近七成的生图工作量。

光驰矩阵的发起人、青年导演李宁利用Vidu预创作了一段电影男主的视频片段,其中所有人物画面仅通过男主近景、中景、远景三张定妆照生成。李宁表示,之前的AI电影创作过程多采用传统的文生图、图生视频流程,在分镜的连贯上很难掌控,人物的整体造型很难保持一致,前期需要耗费大量的精力去调试图片,同时画面还容易产生镜头光影失控、图像模糊甚至变形等一系列问题,且随着视频篇幅的增加,这些问题被进一步放大。Vidu “主体参照”功能让人物的整体一致性显著提升,不再需要前期生成大量的图片,人物运动和画面过渡也更加自然,可助力长篇叙事创作。

本质上通过“主体参照”功能的升级是为了提高视频大模型生成质量、技术结合具体产业落地效率,加速AI在具体应用上的落地。目前生数科技推出合作伙伴计划,邀请广告、影视、动漫、游戏等行业机构加入。

目前生数科技视频模型的商业模式分为SaaS 订阅模式与API接口的方式,这也是目前大模型领域普遍采取的商业化试水方式。具体在B端与C端的分布占比情况,唐家渝称,从收入角度来看,B端市场的收入更大。C端产品上线一个月以来,增长曲线非常高。综合判断下来,B端比较明确、比较直接,包含了较为稳定的需求,所以B端会是公司长期重点的方向。而C端产品目前还处在不断探索过程中。

智谱CEO张鹏此前发布智谱清影(Ying)时谈及行业商业化探索,他称,从现在这个阶段来说,无论ToC还是ToB,纯粹走向大规模商业化还比较早期。所谓收费策略更多是一种早期尝试,也观察下市场和用户的反馈,进行及时调整。

Sora炸圈后哑火,国产视频大模型接棒降门槛

视频大模型的下一步在哪里?

除了具体功能层面的升级更新,目前行业普遍共识于多模态是大势所趋,而视频大模型是阶段性状态。

对此,张鹏表示,视频生成并非孤立存在,而是放到整个技术和产品发展路线当中,智谱认为它是多模态或者AGI多模态路径当中的一环。从产品角度来讲,视频生成也会单独成为一个独立产品去实现商业化落地,进而产生价值。唐家渝也对记者表示,生数的底层是通用大模型,视频生成只是一个中间阶段。

迈向多模态的过程中,多款视频模型密集发布的状态会否造成同质化问题?对此,唐家渝对记者称,在技术路线上,生数现在处于收敛状态,但同质化并不代表所有进展与能力都相同。如现在的语言模型都会涉及Transformer架构,但现实来看,OpenAI还是明显领先的。因为在架构基础上,中间仍有非常多环节,如如何有效进行Scale up、视频如何有效压缩等,都存在非常多技巧与实践经验。算法技巧、算法难点,包括算法工程化难点等,都是导致目前视频大模型差异性的原因。

至于商业化方面,唐家渝认为行业在商业选择上比较类似,即便是像Sora、Runway等企业也都在积极拥抱好莱坞,或进行广告合作等,因为这些领域属于技术天然容易落地的领域。整个行业正在利用自身特点向前走,整体AI生成视频领域还在发展的前期,国际头部玩家在齐头并进,共同扩大市场。

对于视频模型领域的密集发布情况,张鹏认为可控性是行业需要花大力气去做的事情。一方面在技术层面,视频本身的可控是非常大的要求。其次从安全性角度来看,因为视频信号里包括的内容和细节更多,需要保证生成出来的东西符合要求;最后,生成的内容要做到商业化应用,可控也是必要的条件——既要精准表达创作者意图,且让大家买单。

在基础条件满足之后,目前行业自Sora面世后,对视频大模型的期待更多聚焦于AI取代长视频拍摄手段。张鹏认为从技术发展角度来看,这是一个重要方向,对影视行业的变化也有积极意义。但目前来讲,视频大模型还不足以直接用在面向观众的生产过程中,但可以用来做辅助工作,甚至是小规模创作,距离真正改变电影制作等高要求还有一段路要走。

至于出场即高潮、至今未对外开放的Sora,行业仍将其视为追赶标的,但由于技术细节上不透明,很多地方需要企业自己摸索。至于Sora的“销声匿迹”,唐家渝对记者分析称,原因可能在几方面:视频不是OpenAI目前的主线;部分数据版权问题未得到解决;生成过程中产生了其他问题,需要花费一定时间与成本解决,不符合公司的优先级。

张鹏与智谱一直客观正视与世界顶级水平之间的差距,同时他认为这条路还是得自己走,很多时候中国企业也是在用自己的方式向前追赶,比如如何将视频生成算力成本降下来,将响应速度提升上去,让所有人可以用等。“我们在追求技术高度的同时,也在同步追求技术的可普及性。”张鹏称。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-12 11:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

国产“Sora”亮相中关村,文生视频相关个股有哪些
...行业来说,AI视频模型的出现,将极大地降低拍摄剧集的门槛。做了20年影视导演的某位业内人士,看到AI视频后说的第一句话是“要变天了”,第二句话是“我直到今天才庆幸自己是个导演
2024-04-28 15:37:00
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
...择、需求匹配、结果准确性、数据保密、落地成本、技术门槛的挑战仍在不断涌现。汤道生总结道,腾将通过打造高性能的模型、高效率的工具平台、高敏捷的场景应用、高可用的算力基础设施,以
2024-05-21 21:30:00
Pika、阿里同日炫技!国产视频大模型奋起直追
...即可生成较高质量和完成度视频内容,这降低了视频创作门槛,让业外人士能够精准用视频进行内容展现,有望广泛赋能各细分行业的内容生产降本增效和创意输出。国盛证券宋嘉吉此前指出,AI
2024-03-01 09:26:00
AI视频新战场:字节对决快手、反击Sora
...策略切入市场,掀起价格竞争,但高性能模型仍保持付费门槛。B端市场对豆包视频大模型的接纳度有待观察,其商业变现与用户场景适配性成为主要考验。@科技新知 原创作者丨萧维 编辑丨蕨
2024-09-30 13:34:00
国产AI可以拍微电影了!4K、60帧高清画质,自带音效
...视频,在内容逻辑和视觉上基本上可以够到短视频制作的门槛。加之CogVideoX还支持非常多的尺寸,更符合用户在各种场景下的制作需求。而最为关键的一点,随着CogSound把视
2024-11-09 09:54:00
360宣布无偿为DeepSeek提供安全服务
...,DeepSeek以其开源、免费的特性显著降低了AI应用的技术门槛和成本,在保持高准确性的同时超越了高端GPU性能的限制。其R1模型日前发布后引发美股恐慌,美股科技股尤其是芯
2025-01-28 21:34:00
快手大模型首次集体亮相 获《焦点访谈》报道关注
...包括可灵在内的技术革新,将极大的降低视频内容制作的门槛,让更多有创意的人不再受限于设备和成本,凭借创造力和想象力就可以进行视频生产。这也预示着技术普惠时代的到来,彰显了以人为
2024-07-08 10:10:00
《2023年度AI设计实践报告》发布:国产AI工具有巨大潜力
...妆等行业。《报告》认为,国产AI工具有着巨大的潜力,门槛较低、支持中文、亚洲审美是当下国产AI工具的重要优势。就工作流而言,AI目前主要充当创意辅助,仍需结合传统工具才能完成
2023-12-05 18:23:00
深耕AI应用!超算互联网《国产大模型应用生态图谱》权威发布
...流程开发工具链和普惠算力支持,助力开发者降低AI应用门槛,推动国产大模型技术在各行业的创新应用。
2025-07-14 16:35:00
更多关于科技的资讯:
正雅发布2025年度发展报告:全球布局持续深化
2025年,正雅在正畸技术研发、国际学术交流与海外市场布局等方面持续推进,多项阶段性成果逐步落地,GS颌位重建技术的临床应用规模与国际影响力进一步扩大
2026-01-06 11:14:00
元旦假期厦门消费市场“火力全开”“以旧换新”带动消费超5000万元东南网1月6日讯(海峡导报记者 孙春燕)新年伊始,厦门消费市场就展现出十足的活力
2026-01-06 12:42:00
这家人工智能科普馆带你开启奇幻旅程
2025年12月21日,在廊坊市人工智能科普馆,讲解员为小朋友讲解AI知识。河北日报记者刘杰摄当好奇心满满的孩子邂逅AI前沿技术
2026-01-06 12:43:00
夸克等AI眼镜首次被纳入以旧换新“国补”范围 商务部开启调研
2025年12月30日,国家发改委、财政部发布《关于2026年实施大规模设备更新和消费品以旧换新政策的通知》(简称“通知”)
2026-01-06 13:31:00
传统城市形象传播中,政府是主导者。而具创新性的广州“城市合伙人”计划则打破传统赞助模式的边界,向全球征集“奋斗共同体”
2026-01-06 11:04:00
河北日报讯(记者刘英)近日,《廊坊市人工智能产业聚集区建设方案》(以下简称《方案》)正式发布,系统谋划布局人工智能产业发展新蓝图
2026-01-06 08:14:00
京津研发河北转化进行时(五):创新种子何以在这里开花结果
近三年间,12项京津研发成果在晨光生物完成转化创新种子何以在这里开花结果近日,位于曲周县的晨光生物科技集团股份有限公司中试中心内
2026-01-06 08:18:00
四中全会精神在基层|“产业大脑”高效协同 线缆企业多重受益
2025年12月6日,宁晋县河北易缆网络科技有限公司展厅,易缆网平台负责人王洪喜介绍平台功能。 河北日报记者 闫德见摄2025年12月6日10点30分
2026-01-06 08:25:00
福建省“最美科技工作者”、厦门金鹭研发工程师高兰兰:微米之间磨刃 宝刀谁与争锋
高兰兰介绍立铣刀切削的弧度和精度。用UP300系列通用高性能立铣刀切削而成的“青鸾”金属雕塑。厦门网讯 (文/厦门日报记者 李晓平 图/厦门日报记者 黄晓珍)在金属切削的微观世界里
2026-01-06 08:38:00
厦门网讯 (厦门日报记者 林露虹)2025年12月以来,厦门企业融资捷报频传,主要涉及人工智能、新材料领域,彰显厦门在培育新质生产力方面的蓬勃活力
2026-01-06 08:38:00
临沂圣陶高级中学举行高三英语教学传承分享会
鲁网1月5日讯近日,临沂圣陶高级中学“杏坛薪火·师道赓续”专家教师教学传承分享会如期举行,为高三英语一轮复习注入新动能
2026-01-06 09:37:00
20个福建品牌入选中国消费名品其中5个来自厦门,分别为银鹭、暴龙、鹭岛卫浴、瑞尔特和燕之屋东南网1月6日讯(海峡导报记者 黄奕琳)昨日
2026-01-06 10:33:00
厦门网讯(厦门日报记者 沈彦彦)新年伊始,政策红利与节庆消费碰撞出红火“好市”。据厦门市商务局发布的数据显示,2026年元旦假期
2026-01-06 08:38:00
国补山东落地 山东消费者来京东换新单人至高可省11000元
1月4日,2026年国家以旧换新补贴落地山东,京东线上线下全面承接国家补贴落地。山东消费者到京东APP搜索“山东以旧换新”即可进入国补页面
2026-01-06 10:12:00
内存硬盘身价翻倍 存储产品成“年度理财产品” 业内预测:今年手机、电脑将迎来涨价
移动固态硬盘价格比一年前明显上涨“年初买的内存条年底价格已经翻倍!”“不看购买记录不知道,一看吓一跳,连固态硬盘的‘身价’都在一直上涨
2026-01-06 08:09:00