• 我的订阅
  • 科技

中国首个高一致性、高动态性视频大模型发布

类别:科技 发布时间:2024-04-29 11:26:00 来源:浅语科技

清华大学联合生数科技正式发布了中国首个高一致性、高动态性视频大模型Vidu。从放出的视频来看,Vidu生成的视频效果非常惊艳,在一致性、运动幅度等方面已经达到了Sora的水准,虽然比不上Sora的时长,但整体上已经可以对标Sora。

中国首个高一致性、高动态性视频大模型发布

Vidu:“画室里的一艘船驶向镜头”

中国首个高一致性、高动态性视频大模型发布

Sora:“逼真的特写视频,展示两艘海盗船在一杯咖啡内航行时互相争斗的场景。”

不过,无论是Sora还是Vidu,目前都还没有正式发布,而且除了视频生成的时长以外,成功率、质量对于视频生成大模型而言也是非常重要,所以真实差距或许还有待日后仔细比较。但无论Sora还是Vidu,其更大的意义还是在于采用了新的技术。

据了解,目前市面上很多视频生成工具增加视频长度的思路是采用插帧技术,这种方法通过在原始视频帧之间插入额外的帧来提升视频的流畅度和长度,还有一些工具则主要通过组合不同的模型和技术来生成较长的视频,在一些较为简单的视频动画制作中,已经呈现出了非常不错的效果。

中国首个高一致性、高动态性视频大模型发布

此前央视制作的文生视频AI动画《千秋诗颂》

但与此同时,这两种方式都可能会在内容的流畅性和视觉表现上显得不够连贯,缺乏自然的过渡效果,还会出现画质下降,尤其是在快速运动或阴影处理上的扭曲和模糊等一系列问题。

而Vidu采用了和Sora完全一致的Diffusion和Transformer融合的架构,底层基于生数自研的U-ViT架构,是第一个融合了Diffusion和Transformer的架构,据称比Sora的DiT架构早了一年。生数科技联合创始人兼CEO唐家渝表示,生数科技在3月份就实现了8秒的视频生成,在4月突破16秒,未来还将继续加速迭代。

中国首个高一致性、高动态性视频大模型发布

公开数据显示,生数科技成立于2023年3月,核心团队来自清华大学人工智能研究院,还有来自北京大学、阿里巴巴、腾讯、字节跳动的多位技术人才。公司员工总数近90%为研发人员。

中国首个高一致性、高动态性视频大模型发布

去年6月,生数科技获得蚂蚁集团、BV百度风投、卓源资本的近亿元天使轮融资;8月,完成了数千万元天使+轮融资;今年3月,生数科技完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-04-29 15:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

中国首个长时长、高一致性视频大模型vidu发布
...数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,还在加速迭代提
2024-04-29 09:10:00
我国自研视频大模型面向全球上线
...首席科学家朱军介绍,Vidu具有“长时长、高一致性、高动态性”的特点,可根据文字和图片生成高清视频,且能保持高流畅、高动态的画面效果。截至目前,Vidu可支持一次性生成最长3
2024-08-02 03:11:00
...数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型——Vidu。清华大学教授、生数科技首席科学家朱军介绍,Vidu在多个维度上实现了技术突破。它可以模拟真实的
2024-04-28 18:59:00
对标Sora!首个国产纯自研视频大模型Vidu全球上线:30秒生成
...论坛首秀,经过几个月完善,Vidu不仅延续了4月展示的高动态性、高逼真度、高一致性等优势,还新增了角色一致性、动漫风格、文字与特效画面生成等特色能力。值得一提的是,Vidu在
2024-08-01 16:34:00
...坛年会上首次发布我国自研的具“长时长、高一致性、高动态性”特点的文生视频大模型Vidu。记者从会上获悉,这一视频大模型由清华大学联合北京生数科技有限公司共同研发,可根据文本描
2024-04-28 05:58:00
国产“Sora”亮相中关村,文生视频相关个股有哪些
...合清华大学共同研发,是我国首个长时长、高一致性、高动态性视频大模型。Vidu的发布,表明我国在视频大模型领域已初步具备对标Sora的能力,标志着我国全面进入视频大模型自研时代
2024-04-28 15:37:00
Sora炸圈后哑火,国产视频大模型接棒降门槛
...始人兼首席科学家朱军教授发布了长时长、高一致性、高动态性视频大模型Vidu,可以一键生成长达16秒的视频。此次技术更新,Vidu视频最长可以生成32秒。2024年,整个大模型
2024-09-12 09:57:00
“国产Sora”Vidu全球上线,中国视频大模型支棱起来了?
...生数科技大家最关心的视频内容方面,Vidu同样展现出了动态性、逼真度、一致性等特点。比如这段根据随机描述词生成的视频,展示了一个在昏暗的火车车厢中发生的故事,视频运镜与描述词
2024-08-01 09:58:00
【聚焦·科博会】走进“超高清视听科技展”,零距离感受超高清前沿黑科技
...大放异彩生数科技展示了国内首个长时长、高一致性、高动态性的视频大模型-Vidu。该模型支持一键生成长达32秒的视频,实现了音视频合成以及从单一视频生成时空一致的4D内容的能力
2024-07-19 10:33:00
更多关于科技的资讯: