• 我的订阅
  • 科技

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

类别:科技 发布时间:2024-08-01 09:32:00 来源:市界

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

2024年2月,Sora的横空出世,让许多大模型公司的春节都没能过好。

“春晚还在重播,我们就在紧急拉群讨论”,一家AI头部公司员工对「市界」急切地说。看到Sora丝滑的体验,连卖课博主都蜂拥而动,赶着上线教程,大赚一把。

谁能最快时间“复制”出国内版的Sora,更多人将目光放在了阿里、百度、“大模型五虎”身上。但无人想到,拔得头筹的会是技术表现相对“佛系”的快手。

6月7日,快手突然上线了文生视频模型“可灵”(Kling),并可支持长达2分钟的视频生成。此外,与Sora至今仍在“期货”阶段相比,可灵一经公布便开放了测试,生成效果亦可圈可点。

“可灵是最近圈内,被讨论最多的对象”,一位风投行业人士对「市界」说。据官方数据显示:可灵上线一个月有超50万人申请,已开放给超30万用户使用,生成了超700万条短视频。

可灵的意外火爆,不免让字节有些尴尬。今年5月,字节也开放了文生视频模型“即梦”测试,但效果在目前火爆的文生视频赛道中,尚不具明显优势。

突然被曾经“忽视”的对手甩开身位,字节需要埋头追赶。据钛媒体报道,近期,字节跳动将AI大模型设为集团“P0最高级别”的方向。抖音、剪映等多个团队也在抓紧研发AI视频模型应用,预计将在近期公布。

1、做可灵,快、糙、猛

多位开发者对「市界」表示,可灵的上线与亮眼表现,在行业内也算是个意外。

近日,「市界」以一段“黑猫”为关键词,在可灵、即梦,以及智谱AI刚刚上线的“清影”中分别输入了相同的提示:“下雨天的城市街道上空无一人,一只可爱的黑猫奔跑而过。它的眼珠是绿色,脖子上带有黄色的项圈和铃铛,全身长着黑亮的长毛。视频用摄像机的视角拍摄,地面的积水反射出黑猫的身影。”

在生成的三段视频里,可灵版虽然未能实现快速奔跑的效果,但视频大致符合客观规律。

与之对比,“即梦”版地面没有积水,黑猫也没有向前走动。“清影”版虽有积水,黑猫行走时,步态古怪,尾巴也出现了丢帧。

▲(视频依次为可灵、即梦、清影生成作品)

据“硅星人”报道,可灵是快手花了3个月的时间打造的;团队规模很小,仅有20余人,牵头人是现快手视觉生成与互动中心负责人万鹏飞,其大部分的研究方向为图像/视频信号处理、计算摄影和计算机视觉、减少Loss函数、视觉生成等。

可灵的前身,来自快手在2023年10月重启的一个不起眼的项目“噗叽”,这是一款将静态图片通过AI生成2s Gif表情包的工具软件。今年3月初,快手内部开了一个小会,万鹏飞的想法得到了快手高级副总裁盖坤(于越)的肯定,迅速确定了将噗叽作为预调研的产品。

据“硅星人”了解,“做可灵的时候,执行层面有个共识,就是快、糙、猛。”

可灵项目开始不到一个月,就获得了快手创始人程一笑的支持,将其视为公司战略级项目。盖坤也常说:公司的卡都给你们用,公司全力支持。

数字人赛道创业者柯燃对「市界」分析道:“可灵的成功,很大程度上要归功于快手积累的视频数据素材。放眼国内,这方面可以与之一战的也只有抖音。”

可灵风光的同时,字节显得有些落寞。

虽然“即梦”5月9日便官宣上线;6月17日,即梦也作为首席AI技术支持方,在AIGC短剧集《三星堆:未来启示录》中亮相。但无论是在C端的表现,或是相较于快手7月13日上线的AIGC短剧《山海奇镜》,即梦的声量均不甚响亮。

7月17日,市场曾传出消息称,字节将公布类Sora的文生视频技术进展。外界也将其解读为,字节要奋起直追,与可灵正面迎战了。

但字节方面随后向「市界」表示,该消息并不准确。7月17日当日,「市界」注意到,活动更类似一场技术分享会。会议主要由豆包大模型视觉基础研究团队负责人冯佳时主持,并由字节研究科学家、机构学者等,做了整场的英语技术分享。

看起来,字节的“大招”或许还需要等些时日。

2、字节还没回过神

那么,在最近如火如荼的文生视频赛道里,字节为何错过盛宴;最近字节又在忙些什么?

某种程度上,或许因为比起快手押注“可灵”,可以“一力降十会”。字节的大模型布局要更为复杂——而今年上半年,字节更重要的对手放在了腾讯与阿里。

面对大模型,字节的步调已不可谓不“激进”。毕竟2个多月前,率先在行业内发起大模型价格战的,正是字节。

5月15日,在字节跳动“FORCE原动力大会”上,字节推出了基于其自研豆包大模型的API服务。同时,火山引擎总裁谭待一步到位,亮出了“豆包”的最新价格:0.0008元/千Tokens,宣布这是低于行业99.3%的“地板价”。

彼时,字节的“发难”曾先声夺人。据「市界」从多方了解,头部玩家对字节的出击缺少准备;各方虽感无奈,也只能被动追随。

接下来几天,阿里云、百度文心大模型、腾讯云先后宣布,将旗下大模型推理输入token以及API大幅降价。在此影响下,如今头部大模型的C端调用,已几乎悉数免费,行业也开始朝着下一个生态量级“卷”去。

据一家法律AI应用企业创始人向「市界」透露,API服务开放后几乎没有时间差,火山引擎的销售人员就开始积极接触客户、推介产品。这也侧面印证了,市场流传的字节已将大模型标记为最高级别战略的猜测。

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

▲(谭待于2024“FOECE大会”。图源/火山引擎)

而最近,字节的“当家产品”豆包,增长得较为明显。

据Questmobile数据显示,截至2024年6月,在国内AIGC App中,豆包、天工、Kimi智能助手、猫箱增长亮眼——其中豆包流量排名第一。

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

▲(图源/QuestMobile)

与快手相比,字节如今更在意的,或许是从基础大模型、到AI应用层的全生态竞争。此外,考虑到2021年才正式做云的火山引擎,在巨头云厂商里是“最年轻”的一朵。三年多来,火山云也一直被视为云市场的挑战者角色。字节如何将基础大模型、应用层、云市场协同起来,更是一项综合命题。

近日,据“光子星球”报道,字节“扣子”平台的大量使用者,正寻求如何将创建的智能体、bot接入微信公号或小程序,讨论十分活跃。

去年12月,字节在海外推出了AI应用开发平台“coze”。今年2月,国内版“扣子”上线。大量抖音体系商家,也希望从中迅速掘一桶金。

考虑到腾讯在今年5月才姗姗来迟,发布了AI智能体创作与分发平台“腾讯元器”。彼时,扣子的访问量已达到了233万次。而截至目前,腾讯元器尚未打通小程序、公众号、客服订阅号微信系列生态。

毕竟当下,AI发展仍在早期阶段。字节与腾讯一样,都还需要花费大量时间教育用户。争夺AI时代的分发权,先声夺人,或许是字节为了瞄准腾讯要做的更大功课。

3、后发制人,尚有时间

站在行业层面,在当今互联网中,最不缺内容流量、电商流量,以及资金弹药的字节,即便短期在文生视频中“落后”一步,从长期来看,仍具备后发制人的潜力。

用积极的市场策略追平落后身位、大力出奇迹,同样也是字节的拿手好戏。

最近,瞄准阿里,字节也在做整合大模型的工作。在刚刚过去的6月26日钉钉生态大会上,总裁叶军宣布除了阿里自家的通义外,还将把其余6家的第三方大模型装入钉钉中。其中包含MiniMax、月之暗面、智谱AI、猎户星空、零一万物和百川智能,涵盖了国内几乎所有知名的大模型创企,要“构建中国最开放的AI生态”不言自明。

而与钉钉玩法类似,字节旗下扣子平台除了支持自家的“豆包”外,还接入了通义千问、月之暗面、MiniMax等各大外部模型。6月14日,扣子还上线了“模型广场”功能,支持用户选择匿名的两个模型,根据生成内容的表现来为其打分PK。

快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧

此外,字节近期被曝光,对“AI+硬件”的探索正在加快,并不惜通过收购延揽人才。

据“Tech星球”报道,字节旗下的PICO从去年下半年开始在研发多个穿戴设备,包括耳机和音响,这些设备也将搭载AI。字节豆包团队也有基于大模型软硬件结合的探索,大模型软硬件结合已经逐步在学习机、机器狗、机器人等硬件设备上有所应用。

另据36氪报道,字节AI硬件“D线”负责人为李浩乾。后者为字节在今年3月份收购的OWS(Open Wearable Stereo,开放式可穿戴立体声耳机)耳机品牌Oladance的创始人。另一条AI硬件条线“O线”的负责人也是字节曾收购公司的创始人,其向字节跳动技术副总裁洪定坤汇报。

而在文生视频方向,面对赛道刚刚的火爆,包括字节在内的追赶者们,大家都还有时间。

近日,一位开发者告诉「市界」:“现在就是用可灵构构图、减负工作流程,还不到完全用它创作的程度,所以也还没有什么依赖性。”

而在另一位开发者、短视频AIGC博主的眼中,可灵还有不少优化空间:“靠可灵文生视频不能保证虚拟人IP的一贯性。我一般都是用可灵图生视频的功能,相当于给可灵‘垫’一张图,让他在这个基础上生成不同视角动态视频,再拼接到一起,模拟运镜的效果,实际上还是人操作的比重更大。”

国内某AI模拟交友产品的研发成员则讲道:“现在的大模型应用市场,大家都在摸着石头过河。怎样商业化是一个太遥远、太模糊的问题。但可以肯定的是,越多人用起来、玩起来,越能保证产品的优化迭代。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-01 12:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

视频生成大模型sora和可灵的区别在哪里?
...者将OpenAI官方公布的5条Sora视频提示词投喂给可灵,对其文生视频的能力进行测试,同时从动态、视效、细节、场景等多维度表现进行结果比对和关联。测试和观察后发现,虽然在部
2024-06-26 14:27:00
AI视频新战场:字节对决快手、反击Sora
...分辨率高达1080p,时长最高可达2分钟(帧率30fps),单次文生视频时长已增至10秒,指标全部位于业绩前列。工具从来都是辅助,而快手可灵俘获用户的速度之快,让人始料不及。
2024-09-30 13:34:00
文生视频大模型,短视频的过弯点?
...今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的
2024-07-30 14:08:00
快手财报,有「惊喜」也有「隐忧」
...接的竞争对象字节为例,其更早发力的即梦AI,同样拥有文生视频和图生视频的能力,且商业模式与快手的可灵AI近似。今年5月,即梦AI还超过了字节另外两个快速增长的产品,豆包和红果
2025-05-28 19:37:00
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频
2024-12-04 09:56:00
字节回应“中文版Sora”:目前无法作为完善产品落地,与...
...推出“中文版Sora”?近日有传言称,字节跳动在Sora引爆文生视频赛道之前,已经在研发“中文版Sora”:一款名为Boximator的创新性视频模型
2024-02-20 18:40:00
全网刷频的Sora,有多“可怕”
...预兆和消息透露的情况下,OpenAI 突然发布了自己的首个文生视频模型:Sora,大幅刷新行业多个指标,重新定义了 AI 文生视频在现阶段的技术极限
2024-02-19 09:22:00
用短剧跟阅文拼,番茄小说胜算几何
...t营收超6700万美金(数据来源“Tech星球”)之际,阅文、快手等短剧“玩家”也无不加码短剧互动玩法之下,字节关停这一短剧热门分支背后,或许某种程度是说明,字节集团对短剧的
2024-06-27 13:40:00
Sora被戏称“期货”,国产Sora上演“向左走,向右走”
ChatGPT引爆新一波人工智能浪潮,Sora再掀大模型文生视频巨浪,如今AI文生视频领域,进入逐鹿商用战场阶段,一时间,八仙过海、各显神通。值得关注的是,逐鹿商用落地,两种主流
2024-08-29 17:32:00
更多关于科技的资讯:
■王哲娟摘要:在数字化与知识经济时代,企业的竞争边界不断扩展,组织间的关系由单向依附转向多层协同。协同创新成为企业嵌入生态系统
2026-01-05 05:42:00
东南网龙岩1月4日讯(通讯员 詹春艳 林培民)近日,龙岩市新罗区10千伏中新线上空,一场静默而精准的“人机协同”带电作业悄然完成
2026-01-04 23:27:00
蔡高民:颠覆认知!打破西方理论垄断!中国老年学自主知识体系诞生
《全生命周期养能力发展与医养结合:理论和实践》的核心突破,在于建构“养”的元概念、定义与内涵外延,并以此为基础构建了逻辑自洽的三大理论体系
2026-01-04 20:15:00
编者按:周期更迭,变量叠加。站在“十五五”开局之年的关键节点上,各行业如何调整节奏、校准路径、寻找增量?中新经纬广邀多领域学者
2026-01-04 20:21:00
春节临近,年味渐浓。在贵阳,一场不同于传统年货市集的新春活动正在酝酿——它以“创意游乐场”为定位,融合在地风物、潮流文化与青年创造力
2026-01-04 21:50:00
不经意晃动手机,软件立即跳转购物页面。最近,记者实测发现,备受诟病的“摇一摇跳转”广告乱象依然时有发生,困扰着不少用户
2026-01-04 17:59:00
2025年度帆书APP经典热搜榜,精准解锁经典中的成长指南
当“信息过载”成为常态,“选择困难”深入骨髓,我们比任何时候都更需要一个清晰的信号:什么才是值得投入时间的真知?近日,帆书APP根据全年用户收听数据发布的“经典热搜榜”
2026-01-04 14:25:00
黄鹤权据光明网报道,英国《剑桥词典》将2025年年度词汇定为“准社交”,形容个体单方面与名人、虚拟角色或聊天机器人产生的密切连接感
2026-01-04 14:25:00
飞晟科技入选海南省儋州市中小企业数字化转型城市试点服务商
近日,海南省儋州市科学技术和工业信息化局对外公示《儋州市中小企业数字化转型城市试点服务商拟纳入名单(第一批)》。公示名单显示
2026-01-04 15:28:00
抖音生活服务联合南京德基广场落地“心动街区”,电视台直播+明星见面会+打卡活动助力商圈消费
12月30日,抖音生活服务“心动街区”活动联合江苏电视台城市频道零距离栏目发起“心动德基24h·南京跨年在德基”美食专场直播
2026-01-04 15:30:00
浪潮卓数大数据旗下公司入围多项2025年山东省大数据产业“三优两重”项目
近日,山东省工业和信息化厅正式公布2025年山东省大数据产业“三优两重”项目名单。浪潮卓数大数据旗下天元征信公司、浪潮(山东)大数据科技有限公司
2026-01-04 15:31:00
华麟数科推出联盟生态链“麒麟链”,加速数字经济深度融合与转型
【中国,2026年1月】 —— 在数字经济浪潮席卷全球、深入渗透各行各业的关键阶段,华麟数科(广东)有限公司(以下简称“华麟数科”)正式宣布
2026-01-04 15:31:00
以具身智能赋能教育未来----开普勒机器人助力高校产学研融合创新
在新一轮科技革命与产业变革加速演进的背景下,人工智能正从"算法与算力"的竞争,走向"智能体与真实世界深度融合"的新阶段
2026-01-04 15:33:00
中国首个!新奈发布“智能呼吸工程体系”,破解家用呼吸设备长期安全难题
在睡眠与呼吸健康领域,真正的改变往往不是某一功能的增加,而是背后那套长期支撑它持续进化的技术体系。2025年12月,新奈 Synaire 对外发布年度科研成果
2026-01-04 15:33:00
中国科技定义未来运动 HURA超现实远程赛车亮相世界未来运动会
2025年12月18日至23日,全球体育科技前沿的目光齐聚阿联酋首都阿布扎比国家展览中心。在这里举办的2025世界未来运动会(Games of the Future 2025)上
2026-01-04 15:33:00