我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
OpenAI直播划水的一天,谷歌版Sora迎来了它的2.0——
Veo 2,根据文本或图像生成更为高质量的视频。
从官方介绍中看,此次主要有三个方面的升级。
分辨率能达到4K;能够理解有关镜头控制的Prompt;更注重现实物理世界与人类表情的理解和展示。
在官方账号底下,大家都对这些效果表示了惊叹:
我真的想谷歌输掉比赛,但是谷歌没有输。
另外,图像生成模型Imagen 3也有进一步的改进。
谷歌版Sora2.0:重新定义质量和控制
质量和控制,是此次视频模型升级的关键词。
除了显而易见的清晰度的提升——最高可达4K分辨率,它能够忠实地遵循简单和复杂的指令Prompt,并令人信服地模拟现实世界的物理以及各种视觉风格。
具体体现在它的真实感和保真度上,比如细节、伪影减少等方面都有显著改进。
还有高级的运动功能,基于对物理学的理解,能够更高精度的表示运动。
还能准确地遵循各种镜头控制类的Prompt,比如拍摄风格、角度、动作以及所有这些的组合。
那么在根据人类对其性能的评估中,Veo 2 的表现优于其他领先的视频生成模型
在Meta基准数据集 MovieGenBench上,人类参与者观看了1003个提示和响应的视频。
结果显示,跟市面上的主流视频生成模型相比,Veo2.0在整体偏好、Prompt指令准确遵循方面都表现最佳。
值得一提的是,这里除了Sora,国产模型可灵、MiniMax都上桌了。
所有的比较都在720P分辨率下进行,Veo 采样时长为 8 秒,VideoGen 采样时长为 10 秒,其他型号采样时长为 5 秒。我们向评分者展示完整视频时长。
最后,他们表示,创建逼真、动态或复杂的视频,并在复杂场景或复杂运动的场景中保持完全一致性仍然是一项挑战。他们将继续开发和改进这些领域的性能。
图像模型Imagen 3也增强了
除此之外,还增强了他们的图像生成模型Imagen 3。
可以生成更多样化的艺术风格,如现实主义、梦幻、肖像画等等。
生成的图像会更忠实于Prompt,哪怕这个Prompt有多么地离谱。(Doge)
而从各种生成的图像来看,视觉效果也比之前更明亮,构图也更加平衡。
好了,感兴趣的朋友可戳下方链接了解更多详情。
参考链接:[1]https://deepmind.google/technologies/veo/veo-2/[2]https://x.com/GoogleDeepMind/status/1868703624714395907[3]https://deepmind.google/technologies/imagen-3/
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-12-17 12:45:04
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: