• 我的订阅
  • 科技

快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验

类别:科技 发布时间:2024-06-07 09:20:00 来源:扬子晚报

在OpenAI文生视频大模型Sora发布后,国内企业争相入局,国产文生视频大模型迈入加速阶段。近日,又一国产视频大模型加入战局,快手“可灵”视频生成大模型官网正式上线。相较此前各家放出的视频大模型以展示视频为主,本次亮相的可灵大模型不但效果对标Sora,且已在快手旗下的快影App开放邀测体验。

快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验

可灵大模型官网

作为短视频领域头部玩家,快手在短视频视频技术方面有多年的深入积累,其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研,采用类Sora的技术路线并结合多项自研创新技术,具备诸多优势:1、能够生成大幅度的合理运动;2、能够模拟物理世界特性;3、具备强大的概念组合能力和想象力;4、生成的视频分辨率高达1080p,时长高达2分钟(帧率30fps),且支持自由的宽高比。具体而言:

可灵大模型能够生成大幅度的合理运动。可灵采用了3D时空联合注意力机制,能够更好地建模视频中的复杂时空运动。因此,可灵大模型不仅能够生成较大幅度的运动,且更符合客观运动规律,能够真正做到让想象力动起来。下面宇航员在月球上奔跑的例子中,随着镜头慢慢抬升,我们可以看到宇航员跑步的动作流畅轻盈,步态和影子的运动合理恰当。

prompt:一名宇航员在月球表面奔跑,低角度镜头展现了月球的广阔背景,动作流畅且显得轻盈

能够模拟真实物理世界的特性。得益于自研模型架构及Scaling Law激发出的强大建模能力,可灵大模型为我们构建起了一个无限逼近现实的想象空间,无论是真实世界的光影反射,重力影响下的流体运动,还是与物理世界的交互,可灵大模型都能够生成符合物理规律的视频。下面是小男孩吃汉堡的生成视频,一口咬下去,汉堡被咬掉一个大大的缺口,并在视频中一直保持。可以看到小孩咀嚼汉堡的享受表情,脸部的肌肉动态非常逼真。

prompt:一个戴眼镜的中国男孩在快餐店内闭眼享受美味的芝士汉堡

具备强大的概念组合能力和想象力。凭借模型对文本-视频语义的深刻理解和基于 Diffusion Transformer 架构学到的强大概念组合能力,可灵大模型能够将用户丰富的想象力转化为具体的画面,让创意触手可及。下面的视频展示了熊猫吉他手坐在湖边弹着吉唱着歌的想象场景。prompt:一只大熊猫在湖边弹吉他

可灵大模型生成的视频分辨率高达1080p、时长高达2分钟(帧率30fps),且支持自由的输出视频宽高比。可灵大模型的自研3D VAE能够将视频编码到紧凑的隐空间并解码成带有丰富细节的视频,可以生成高达1080p分辨率30fps的视频。得益于高效的训练基础设施、极致的推理优化和可扩展的基础架构,可灵大模型能够生成长达2分钟的视频。在推理过程中,还可以做到同样内容输出多种视频宽高比。下面的视频展示了分钟级的视频生成,我们可以跟随镜头,陪伴小男孩骑自行车游览花园,在一镜到底中欣赏春夏秋冬四季的风景。

大模型的生成效果取决于数据的规模和质量、以及大规模训练的效率。可灵大模型在研发过程中,配套建设了高效的大规模自动化数据解决方案,覆盖了海量视频挖掘、多维打标筛选、视频描述增强、及数据驱动的效果质量评估等多个方面。在训练过程中,采用了多种计算优化和通信优化方案,极大提升了GPU和网络带宽利用率,并通过自动故障检测和failover等机制,提供了分钟级故障恢复能力。保障了短时间内模型效果的快速提升。

快影App的AI创作功能中已正式开放文生视频功能的邀测,支持创作者申请并体验可灵大模型最新的文生视频功能。图生视频功能也将于近期开放。

快手发布对标Sora的视频生成大模型「可灵」 已开放邀测体验

快影App还将在近期开放图生视频功能。基于可灵大模型,更多应用方向也已经或即将落地。例如,基于肢体驱动的“AI舞王”功能已在快手和快影App成功落地,用户只需上传一张全身或半身照片,即可体验一键跳舞的乐趣。近期还将首发上线“AI唱跳”新玩法,可以同时驱动表情和肢体动作,仅需一张照片就能生成唱跳“爱你”的生动视频。

随着AI大模型时代来临,作为头部短视频公司,快手已展开全面布局。公开资料显示,快手已先后发布通用大语言模型“快意”、文生图大模型产品“可图”,还推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频关键技术,引发了广泛关注。据悉,伴随此次可灵大模型的发布,快手将持续加速大模型的研发与应用,带来更加多元的AI创作与互动体验。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-07 12:45:29

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

视频生成大模型sora和可灵的区别在哪里?
...型迎来又一轮新品爆发,生成式AI赛道像是“过年了”。快手可灵、LumaAI以及Runway迭代更新后的Gen-3Alpha等现象级爆品不断涌现
2024-06-26 14:27:00
快手可灵大模型开放视频续写功能 可生成最长约3分钟视频
本文转自:中国新闻网快手的视频生成大模型“可灵”自面世以来,以其惊艳效果引发了国内外的广泛关注。 6月21日,可灵再度进化,正式推出图生视频功能,支持用任意静态图像生成5s视频,
2024-06-24 19:53:00
对标Sora!快手自研视频生成大模型可灵AI全面开放内测
快科技7月25日消息,日前,快手视频生成大模型可灵AI宣布基础模型升级,并全面开放内测,同时正式上线付费会员体系。用户每日登录都可免费获得66灵感值,可用于兑换可灵AI平台内指定
2024-07-25 07:57:00
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型再次升级,并全面开放内测。南都记者体验发现,目前清影大模型所有C端用户皆可免费使用清
2024-07-27 14:18:00
蓝色光标Blue AI携手快手可灵AI,共同引领AI视频生成新时代
近日,蓝色光标宣布与快手可灵AI正式签署战略合作协议,就AI视频生成技术研发、平台合作、场景共建、内容创作优化等多维度展开深入合作,共探AI视频生成的无限潜力。蓝色光标自研AI行
2024-09-11 14:48:00
快手“可灵”意外走红,字节紧急追赶,AI文生视频赛道竞争加剧
...。但无人想到,拔得头筹的会是技术表现相对“佛系”的快手。6月7日,快手突然上线了文生视频模型“可灵”(Kling),并可支持长达2分钟的视频生成。此外,与Sora至今仍在“期
2024-08-01 09:32:00
快手「可灵」爆火:海外AI圈巨震,中国版Sora一号难求
...友都感受到了亿点点震撼。右侧的这些生成视频,都来自快手刚刚推出的文生视频大模型「可灵」(Kling)。不是预发布、不是纯 Demo 合集,而是直接开放测试的产品级应用,人人都
2024-06-14 09:10:00
快手出席中国多媒体大会:产学研合作共赢,迎接AGI时代新机遇
...媒体领域技术与应用发展,集结了多媒体领域专业人士。快手高级副总裁、研发线负责人于冰受邀在大会上发表了《AGI时代下智能媒体技术前沿进展与思考》主题演讲,结合快手在多媒体技术领
2023-08-08 15:39:00
快手程一笑:可灵AI商业化单月流水超千万,探索多元变现模式
乐天 11月20日快手科技今日发布2024年第三季度业绩,日活跃用户规模突破4亿里程碑,总营收同比增长11.4%至311亿元。在当晚举行的业绩电话会上,快手科技创始人兼首席执行官
2024-11-21 14:15:00
更多关于科技的资讯:
合肥“机器人大学”新增“家庭课”:VR手把手教学,三个月“毕业”上岗
大皖新闻讯 家里乱了,谁来整理?这些日常家务,未来可能交给机器人。近日,合肥市具身智能机器人数据采集训练场在原有场景基础上
2026-01-08 18:05:00
三国何以“常青”?灵犀互娱发起游戏行业首个三国文化论坛
1月5日,中国游戏行业首个聚焦三国题材的文化论坛——“常青三国:重构、创新与全球化”在广州举行。论坛由南方周末报社与阿里巴巴灵犀互娱联合主办
2026-01-08 17:01:00
都匀佳速健诊所招新媒体运营 五险一金+弹性工作制
多彩贵州网讯(记者雷小露 裘金鉴) 为进一步扩大品牌影响力,推动科技医疗技术的广泛传播,都匀市佳速健健康管理有限公司(都匀佳速健诊所)现面向社会公开招聘新媒体运营专员1名
2026-01-08 17:05:00
【宅男财经|专家面对面】中新经纬1月7日报道称,蔚来创始人、董事长李斌表示,汽车行业和AI行业都在抢铜、银等原材料,原材料涨价还没有传导到终端售价
2026-01-08 14:13:00
中新经纬1月8日电 (谢婧雯)8日,“全球大模型第一股”智谱在港交所主板挂牌上市,发行价为每股116.20港元。智谱开盘价报120港元/股
2026-01-08 14:13:00
记者昨日从中国科学院获悉,“面向空间应用的锂离子电池电化学光学原位研究”项目已在中国空间站内开展,神舟二十一号航天员乘组共同在轨操作该项目实验
2026-01-08 15:08:00
上海晶珩ED-HMI3120:树莓派让工业控制可视化更简单
HMI3120工业人机界面是上海晶珩(EDATEC)最新推出的产品系列,内置树莓派CM5计算平台,融合了高性能处理能力
2026-01-08 15:23:00
26年深耕·千万青年共创:学院奖,链接青年力量与商业未来
当茅台王子酒的“王子音乐节”在高校掀起青春热潮,当可比克实践赛涌现出上千份青年创意实战方案,当江中健胃消食片通过校园共创唤醒品牌年轻记忆——中国大学生广告艺术节学院奖早已超越单纯的赛事维度
2026-01-08 15:25:00
确权破局护品牌,明远领航“大朴”启新程
随着国货家居品牌进入高质量发展阶段,维护品牌核心资产的唯一性已成为企业发展的重中之重。近日,家纺领军企业明远集团正式宣布
2026-01-08 15:26:00
百年守护 因AI而“声”动
2025年,故宫博物院迎来建院百年。 这一百年,是实物守护的百年——从战火中南迁万里护送国宝,到一代代匠人在红墙内对《五牛图》的精心修复
2026-01-08 16:39:00
你“点单”我“买单” 新书配送到家!蚌埠市图书馆“云借阅”受热捧
大皖新闻讯 无需舟车劳顿往返图书馆,只需轻点手机屏幕,崭新的图书便能免费配送到家。1月8日,大皖新闻记者从蚌埠市图书馆获悉
2026-01-08 15:45:00
ChatGPT跟进发布AI健康功能!国内“蚂蚁阿福”月活用户已达3000万
蚂蚁集团旗下“蚂蚁阿福”火爆之后,OpenAI也决定入局AI医疗健康领域。1月8日,OpenAI推出 ChatGPT Health功能
2026-01-08 11:26:00
中新经纬1月8日电 汇源集团发布声明称重新接管汇源品牌。8日,汇源官方微信号发文称,北京汇源食品饮料有限公司(以下简称“北京汇源”)重整一案
2026-01-08 11:58:00
大麦娱乐深度合作2026原神嘉年华,打造“逛展+旅游”一站式省心娱乐体验
日前,《原神》年度线下嘉年华——第三届“原神☆FES”在上海国家会展中心举办。项目独家票务平台大麦数据显示,这场为期4天的线下盛宴共吸引超8万人次奔赴
2026-01-08 13:27:00