• 我的订阅
  • 科技

谷歌推出“文生视频”扩散模型

类别:科技 发布时间:2024-01-29 11:15:00 来源:浅语科技

1月29日消息,谷歌研究院日前推出了一款名为Lumiere的“文生视频”扩散模型,主打采用自家最新开发的“Space-TimeU-Net”基础架构,号称能够一次生成“完整、真实、动作连贯”的视频。

谷歌推出“文生视频”扩散模型

▲图源谷歌官方新闻稿(下同)

谷歌表示,业界绝大多数“文生视频”模型无法生成时间长、质量佳、动作连贯逼真的内容,这是因为此类模型通常“分段生成视频”,首先产生几张关键帧,接着用“时间超级分辨率(TemporalSuper-Resolution)”技术,生成关键帧之间的视频文件,这种方法虽然能够节省RAM,但难以生成“连贯逼真”的视频。

谷歌提到,他们的新模型Lumiere相对于业界模型最大的不同是采用了全新“Space-TimeU-Net”基础架构,该架构能够在空间和时间上同时“降采样(Downsample)”信号,从而在“更紧凑的时空中进行更多运算”,令Lumiere生成持续时间更长、动作更连贯的视频。

IT之家注意到,Lumiere一次可以生成80帧视频(16FPS下5秒视频/24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。

谷歌推出“文生视频”扩散模型

除了应用“Space-TimeU-Net”基础架构外,谷歌还介绍了Lumiere的基础特性,该AI建立在一个经过预先训练的“文生图”模型基础上,研究人员首先让基础模型生成视频分帧的基本像素草稿,接着通过空间超分辨率(SSR)模型,逐步提升分帧分辨率及细节,并利用“Multidiffusion”通用生成框架提升模型稳定性,从而保证了最终输出的视频一致性和连续性。

谷歌推出“文生视频”扩散模型

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-29 15:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频
2024-12-04 09:56:00
文生视频大模型,短视频的过弯点?
...今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的
2024-07-30 14:08:00
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Vide
2024-12-04 09:49:00
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网络梗应用清影生成的视频 )。2024年过半,经过一轮“价格战”后,各
2024-07-27 14:18:00
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.S
2024-05-07 11:13:00
...谷歌全面叫板OpenAI,其中视频生成领域,发布对标Sora的文生视频模型Veo。2024年6月,快手“可灵”视频生成大模型上线
2024-06-11 00:10:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源
2024-12-04 09:48:00
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-16 18:44:00
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
最强开源文生图模型一夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX
2024-08-05 09:39:00
更多关于科技的资讯:
中新经纬12月26日电 据金融监管总局网站消息,为贯彻落实党的二十大和二十届历次全会及中央经济工作会议、中央金融工作会议精神
2025-12-26 21:58:00
拒绝闲置,学而思携手华为打造“亲子共享”学习机
12月25日,学而思与华为深度合作,联合推出基于华为擎云 C5e定制的学而思学习机。这款新品定位为入门款学习机,不仅整合了学而思深耕20余年的优质教育资源与前沿AI技术
2025-12-26 08:49:00
北京远行摘得“金厦奖”,与城市共繁荣
聚焦行业前沿,赋能城市生长。2025年12月23日,第22届中国写字楼产业园发展论坛于北京启幕。这场商业地产领域的权威盛会
2025-12-26 09:20:00
福建首个AI+教育大模型发布它的“大脑”装了6T教育专项数据,既“懂产业”,还“懂学生”“懂教学”东南网12月26日讯 (海峡导报记者 梁静 通讯员 曾妙龄 何贻婷 ) 昨日
2025-12-26 09:35:00
12月12日,由中国通信标准化协会主办、中国信息通信研究院承办的“2025 AI云产业发展大会”在北京成功召开。会上公布了2025年“软件工程智能化领航者”创新应用实践评选结果
2025-12-26 10:49:00
王涵Labubu爆红无疑是2025年最热门的经济现象之一。从外国粉丝排队数小时“抢娃”,到二手市场上部分Labubu溢价超30倍
2025-12-26 10:50:00
天柱山据《中国青年报》报道,清晨六点,北京的胡同里,宠物托管师刘硕已开始一天的忙碌。她轻手轻脚地给客户家的猫咪添粮换水
2025-12-26 10:50:00
破解家政撮合难题,58同城“AI直聘”入选“人工智能+”创新应用
“我想找一位会做饭、做家务的不住家阿姨,最好会做面食和煲汤,可以下午13:00到17:00上户。”在58同城“AI直聘”上
2025-12-26 10:50:00
变频空调哪个牌子技术最强?深度解析空调行业技术标准
变频空调哪个牌子技术最强?这个问题若仅停留在纸面参数的比较,无异于隔靴搔痒。真正的技术巅峰,在于品牌能否将顶尖的实验室数据
2025-12-26 10:54:00
欧姆龙发布《2025统合报告》:以可持续战略驱动未来增长
近日,欧姆龙集团(以下简称"欧姆龙")正式发布了《2025统合报告》,呈现了在"Shaping the Future 2030(以下简称"SF2030")"长期战略指引下
2025-12-26 13:51:00
推开邮储银行唐山玉田县支行的玻璃门,浓郁咖啡香与温暖灯光扑面而来。理财经理正为咨询客户手冲咖啡,这并非咖啡馆日常,而是该支行周三下午的寻常场景
2025-12-26 10:54:00
中新经纬12月26日电 据韩联社25日消息,韩国电商巨头酷澎25日发布新闻资料称,公司凭借通过数字鉴定获取的证据锁定泄露用户信息的前员工
2025-12-26 11:03:00
厦门网讯(厦门日报佘峥)福建省首个AI+教育大模型——“文夔”昨天正式发布,它不仅能帮助教师批改作业、试卷,还能从招聘信息中做出分析
2025-12-26 07:59:00
上传一张聊天截图,便能智能分析用户画像;孕期有疑问,即可一键对话获取专业信息……人工智能高速发展的时代,垂直母婴领域也迎来新的应用落地
2025-12-26 06:39:00
惠及11个停车场 可免费领取 元旦来武林商圈停车有福利
元旦武林商圈有多热闹?购物、打卡、看表演、逛面包节……活动多到停不下来!但你是不是也在担心:车往哪儿停?停车费是不是很贵
2025-12-26 06:39:00