我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
Sora根据彭博提供的提示词生成的视频。(00:09)
有关文生视频模型Sora是否能理解人类物理世界,近期一直是讨论的热点,一段由Sora生成的视频,似乎可以作为参考。
2月23日,有外媒体验后报道称,由记者提供提示词后,OpenAI帮助生成的演示视频中可以看到明显的局限性。该段视频的提示词为:“俯视图,一只鹦鹉飞过青翠的哥斯达黎加丛林,然后降落在树枝上,与一群猴子一起吃一块水果。黄金时刻,35毫米胶片。”
在10秒的视频中,一只鹦鹉飞过丛林,乍看起来没有明显异常。但再看一遍时,却能发现很多问题——鹦鹉飞过猴子时翅膀扭曲了;虽然提示词写的是一只,但却生成了多只鹦鹉;一只猴子在最后的画面中似乎有着鹦鹉的尾巴。
视频生成能力有了明显飞跃,但仍有很长的路要走
“你会在该片段的不同阶段发现一些奇怪的动作,”OpenAISora团队研发负责人Bill Peeble表示,“但Sora能够对如此复杂的场景进行建模这一事实表明,视频生成能力有了明显的飞跃。”
OpenAI表示,Sora距离黄金时期还有很长的路要走。
在Sora亮相之时,OpenAI就表示,目前Sora可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。
Sora生成的视频中,一只大鸭子把人踩没了。
Meta首席科学家杨立昆(Yann LeCun)、AI科学家马库斯(Gary Marcus)等近期也都指出Sora并不能理解人类物理世界。杨立昆认为,仅仅根据提示词生成逼真视频并不能代表一个模型理解了物理世界,生成视频的过程与基于世界模型的因果预测完全不同,“这里存在‘巨大’的误导”。
马库斯对于Sora则表示:“如果你只看一秒钟(的视频片段),你会觉得它太神奇了。但如果你仔细看看,就会发现(这个人工智能系统)仍然不太懂常识。”
Sora视频并非即时生成,何时公众发布仍未知
与文生图相比,Sora需要更长的时间和计算来生成每段视频。
OpenAI没有给出Sora处理每个请求需要多长时间,但Peebles表示“绝对不是即时的”,“在等待这些东西运行时,你可以去吃点东西”。
Sora生成的视频中,蚂蚁有四只脚。
OpenAI目前仅向评估关键的危害或风险的红队成员(red teamers),以及一些视觉艺术家、设计师和电影制作人提供访问权限,以获取有关如何改进该模型以对创意专业人士最有帮助的反馈。OpenAI也没有公布训练Sora的数据等基础细节以及向公众发布的日期。
OpenAI发言人Natalie Summers表示,Sora没有设定发布时间表,是因为公司希望确保它能降低与选举相关的安全风险。2024年世界上很多地区都将进行选举,许多政治家、虚假信息研究人员和技术专家,都担心超现实人工智能的深度伪造技术被用来欺骗选民。因此,现在推出功能强大的新型视频生成工具时机并不是很好。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2024-02-23 23:45:04
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: