• 我的订阅
  • 科技

英伟达推出videoldm,根据文本可生成4.7秒视频

类别:科技 发布时间:2023-04-21 19:40:00 来源:浅语科技

英伟达和康奈尔大学的研究团队合作,近日推出了名为VideoLDM模型,可以根据文本描述,自动生成最高分辨率2048*1280、24帧、最长4.7秒的视频。

英伟达推出videoldm,根据文本可生成4.7秒视频

英伟达表示该模型配有41亿个参数,其中27亿个经过视频训练,这符合现代生成式AI的标准。从博文中获悉,英伟达表示通过高效的潜在扩散模型(LDM),能够创建多样化、高质量、高清晰度的视频。

英伟达推出videoldm,根据文本可生成4.7秒视频

该模型还能创建驾驶场景的视频,视频分辨率为1024×512像素,最长5分钟。英伟达表示目前该项目处于研究阶段,暂时不会向公众开放。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-21 21:45:26

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

英伟达投的Sora竞品免费了!网友挤爆服务器,120秒120帧支持垫图
...,已经打出了一波知名度。Genie能够在10秒内创建3D物体,可生成四边形网格和材料,支持任意多边形数量的标准格式
2024-06-14 09:06:00
“苹果智能”仅面向付费开发者,三大新模块炸裂出圈
...于谷歌设计的TPU(张量处理单元),而非业界广泛使用的英伟达GPU。记者注意到,谷歌TPU的价格相对有竞争力,在三年预订期内,最新型号产品每颗芯片每小时(训练)成本不到2美元
2024-07-31 23:28:00
OpenAI机器人亮相,大模型有了“肉身”,英伟达微软都有投资
...,其实只用了短短十三天。成立两年估值26亿美元,微软英伟达参投Figure是最近硅谷备受关注的新星。公开资料显示,机器人公司Figure成立于2022年
2024-03-14 17:17:00
英伟达推出了一款新的聊天机器人应用程序
英伟达推出了一款新的聊天机器人应用程序,名为“ChatwithRTX”,它可以让用户在不联网的情况下,利用自己的RTXGPU来查询和生成文本
2024-02-16 11:49:00
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...说明合成效果接近真人。Jukebox 由OpenAI开发的音乐模型,可生成带有唱词的音乐。通过分层VQ-VAE体系将音频压缩到离散空间中
2023-01-30 16:34:00
英伟达:AI扮演的NPC难辨真假
...是有一套罐头式的互动。在Computex 2023年的主题演讲中,英伟达首席执行官黄仁勋发布了ACE for Games
2023-05-30 07:00:00
英伟达宣布rtx系列显卡支持微软copilot+计划
6月3日消息,COMPUTEX2024展会伊始,图形芯片巨头英伟达就发布了未来规划,宣告了其拥抱人工智能的决心。英伟达宣布其RTX系列显卡将大力支持微软的全新Copilot+计划
2024-06-03 09:24:00
支持1024帧、准确率近100%,英伟达「LongVILA」开始发力长视频
...(涵盖系统、数据和 pipeline)是必不可少的。本文,来自英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校的研究者引入了 LongVILA
2024-08-22 09:51:00
英伟达超快stylegan回归
...治地位,终于要被GAN夺回了?就在大伙儿喜迎新年之际,英伟达一群科学家悄悄给StyleGAN系列做了个升级,变出个PLUS版的 StyleGAN-T
2023-02-01 14:22:00
更多关于科技的资讯: