• 我的订阅
  • 科技

谷歌推出“文生视频”扩散模型

类别:科技 发布时间:2024-01-29 11:15:00 来源:浅语科技

1月29日消息,谷歌研究院日前推出了一款名为Lumiere的“文生视频”扩散模型,主打采用自家最新开发的“Space-TimeU-Net”基础架构,号称能够一次生成“完整、真实、动作连贯”的视频。

谷歌推出“文生视频”扩散模型

▲图源谷歌官方新闻稿(下同)

谷歌表示,业界绝大多数“文生视频”模型无法生成时间长、质量佳、动作连贯逼真的内容,这是因为此类模型通常“分段生成视频”,首先产生几张关键帧,接着用“时间超级分辨率(TemporalSuper-Resolution)”技术,生成关键帧之间的视频文件,这种方法虽然能够节省RAM,但难以生成“连贯逼真”的视频。

谷歌提到,他们的新模型Lumiere相对于业界模型最大的不同是采用了全新“Space-TimeU-Net”基础架构,该架构能够在空间和时间上同时“降采样(Downsample)”信号,从而在“更紧凑的时空中进行更多运算”,令Lumiere生成持续时间更长、动作更连贯的视频。

IT之家注意到,Lumiere一次可以生成80帧视频(16FPS下5秒视频/24FPS下约3.34秒视频),虽然这一数据看起来很短,不过研究人员提到,5秒视频长度实际上“已经超过大多数媒体作品中的平均镜头时长”。

谷歌推出“文生视频”扩散模型

除了应用“Space-TimeU-Net”基础架构外,谷歌还介绍了Lumiere的基础特性,该AI建立在一个经过预先训练的“文生图”模型基础上,研究人员首先让基础模型生成视频分帧的基本像素草稿,接着通过空间超分辨率(SSR)模型,逐步提升分帧分辨率及细节,并利用“Multidiffusion”通用生成框架提升模型稳定性,从而保证了最终输出的视频一致性和连续性。

谷歌推出“文生视频”扩散模型

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-29 15:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频
2024-12-04 09:56:00
文生视频大模型,短视频的过弯点?
...今年初Sora的横空出世,这个可以创建长达一分钟视频的文生视频模型就成为了国内厂商追逐的焦点。6月初,快手自研的视频生成大模型“可灵”正式上线。可灵AI采用了与Sora相似的
2024-07-30 14:08:00
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Vide
2024-12-04 09:49:00
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...应用清影生成6秒视频只需要30秒的时间,该功能不仅支持文生视频、图生视频,也支持视频生成视频(以下是利用网络梗应用清影生成的视频 )。2024年过半,经过一轮“价格战”后,各
2024-07-27 14:18:00
万兴科技AIGC概念迷雾:60秒文生视频能力遭质疑,开月薪10万招AI人才
图源:天幕文生样板视频截图Sora爆火两月之后,国内迅速有A股上市公司做出跟进,推出同样具备文生视频能力的多媒体大模型。4月28日,A股数字创意软件龙头万兴科技(300624.S
2024-05-07 11:13:00
...谷歌全面叫板OpenAI,其中视频生成领域,发布对标Sora的文生视频模型Veo。2024年6月,快手“可灵”视频生成大模型上线
2024-06-11 00:10:00
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
想要体验文生视频的小伙伴又多了一个选择!今日,腾讯宣布旗下的混元视频生成大模型(HunYuan-Video )对外开源
2024-12-04 09:48:00
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-16 18:44:00
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
最强开源文生图模型一夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX
2024-08-05 09:39:00
更多关于科技的资讯:
2025青岛虚拟现实创新大会将启,星鲨研究院探索“具身智能”前沿
鲁网11月14日讯“在这里,唯一限制你的是你自己的想象力。”科幻电影《头号玩家》中对于“绿洲”的这一描述,恰如其分地展现了虚拟现实产业的无限可能
2025-11-14 10:18:00
中新经纬11月14日电 据“网信中国”微信公众号14日消息,网信部门从严整治利用AI仿冒公众人物开展直播营销问题乱象。近期
2025-11-14 10:30:00
大麦娱乐推出全新品牌“大麦国际” 提供全球演出购票、观演服务
购买海外演出门票,现在有了新选择。11月14日,大麦娱乐宣布推出旗下全新业务品牌、全球演出服务平台“大麦国际(MAISEAT)”
2025-11-14 10:45:00
大河网讯 11月11日,全省数字影像检查“云胶片”联盟采购工作顺利开标,产生了拟中选结果,中原算力科技发展有限公司等6家企业拟中选
2025-11-14 10:53:00
鲁网11月13日讯11月13日,山东瑞程数据科技有限公司与济宁学院联合攻关的“多模态肉品AI快检系统”核心技术,在第十四届中国创新创业大赛颠覆性技术创新大赛中斩获优秀奖
2025-11-14 10:54:00
记者走基层|“黑科技”上线,让温暖精准入户
11月12日,河北邢襄热力集团邢台供热分公司二工区三班班长丁帅,在三义庙换热站查看设备运行情况。 河北日报记者 宋 平摄随着11月15日临近
2025-11-14 08:02:00
11月13日,太原公共交通控股(集团)有限公司(以下简称“太原公交”)与中车时代电动汽车股份有限公司(以下简称“中车电动”)举行框架合作协议签约仪式
2025-11-14 07:50:00
记者走基层|智能安全帽,让矿工有了AI“卫士”
11月5日,中煤张家口煤矿机械有限责任公司所属恒洋电器有限公司工作人员介绍智能安全帽产品。河北日报记者 魏 雨摄“嘀嘀
2025-11-13 08:03:00
“长与短”周期变革,“快与慢”时效重构,“热与冷”业态碰撞—— “双11”三重奏,解读消费新变局□南京日报/紫金山新闻记者黄琳燕11月12日中午
2025-11-13 08:05:00
南报网讯(记者周容璇)日前,在南京医药中央物流中心,一辆白色无人车平稳地穿梭于主仓库与宝湾库区之间,仅用15分钟便完成了一次驳货作业
2025-11-13 08:05:00
向“质”攀升,南京机器人解锁“智造”新图景
全链条持续发力,以硬核技术竞逐市场向“质”攀升,南京机器人解锁“智造”新图景□南京日报/紫金山新闻记者徐宁 实习生黄倩机器人是智能制造的核心组成部分
2025-11-13 08:05:00
江苏南京:“爆单堵件”难寻踪迹,科技赋能让“双11”物流运输“从从容容”
“爆单堵件”难寻踪迹,科技赋能让“双11”物流运输“从从容容” 直播间“秒光” 无人机“闪送”□南京日报/紫金山新闻记者周容璇“3
2025-11-13 08:06:00
逐浪氢能“新蓝海”,南京加速能级跃升
实现全产业链布局,链上企业持续“加码” 逐浪氢能“新蓝海”,南京加速能级跃升□南京日报/紫金山新闻记者徐宁通讯员陈伟伟郑瑞陶炎李雪莹蹲点主题
2025-11-13 08:06:00
2025 脉脉职场新人报告:超50%职场新人想跳槽,校招生最想去字节跳动
脉脉人才智库近日发布《以能为本——互联网职场新人流动趋势 2025》报告,将校招和工作经验在3年内的社招人才界定为“职场新人”
2025-11-13 08:57:00
江苏南京:多点突破屡刷纪录 科创助推产业升级
黄维院士引领南工大柔性电子全国重点实验室闯出新天地 多点突破屡刷纪录 科创助推产业升级□南京日报/紫金山新闻记者谈洁姜静实习生钱逸霖在柔性电子领域
2025-11-13 09:43:00