• 我的订阅
  • 国际

马斯克评OpenAI首个视频生成模型:人类认赌服输

类别:国际 发布时间:2024-02-16 22:16:00 来源:大河财立方

OpenAI周四发布了首个视频生成模型Sora,并展示了几段效果炸裂的演示视频。

一位X用户分享了Sora生成的一名女子在东京街头漫步的视频,并评论称:“OpenAI今天宣布了Sora,它使用混合扩散和变压器模型架构生成长达1分钟的视频。

他们似乎又领先了其他所有人1-2年。以下是我看过的最令人印象深刻的视频,以及生成它们的提示。”

另一位X用户评论称:“gg皮克斯。”

马斯克回应称:“gg人类(gg humans)。”

马斯克评OpenAI首个视频生成模型:人类认赌服输

译注:gg是网络游戏用语“good games”的缩写,主要用于游戏结束后,输赢双方都可以用。但现在多由失败方发出,表示认赌服输、心服口服的意思。

在马斯克帖子的评论区里,还有用户附和道:“gg好莱坞”。

相关阅读:效果炸裂!OpenAI首个视频生成模型发布,1分钟流畅高清,网友:整个行业RIP

刚刚,奥特曼发布OpenAI首个视频生成模型Sora。

完美继承DALL·E 3的画质和遵循指令能力,能生成长达1分钟的高清视频。

马斯克评OpenAI首个视频生成模型:人类认赌服输

奥特曼发布OpenAI首个视频生成模型

AI想象中的龙年春节,红旗招展人山人海。

有紧跟舞龙队伍抬头好奇官网的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

马斯克评OpenAI首个视频生成模型:人类认赌服输

舞龙队伍

雨后东京街头,潮湿地面反射霓虹灯光影效果堪比RTX ON。

马斯克评OpenAI首个视频生成模型:人类认赌服输

效果

行驶中的列车窗外偶遇遮挡,车内人物倒影短暂出现非常惊艳。

马斯克评OpenAI首个视频生成模型:人类认赌服输

效果

也可以来一段好莱坞大片质感的电影预告片:

马斯克评OpenAI首个视频生成模型:人类认赌服输

效果

竖屏超近景视角下,这只蜥蜴细节拉满:

马斯克评OpenAI首个视频生成模型:人类认赌服输

效果

网友直呼game over,工作要丢了:

留言截图

甚至有人已经开始“悼念”一整个行业:

马斯克评OpenAI首个视频生成模型:人类认赌服输

推文截图

AI理解运动中的物理世界

OpenAI表示,正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题

根据文本提示生成视频,仅仅是整个计划其中的一步。

马斯克评OpenAI首个视频生成模型:人类认赌服输

j截图

目前Sora已经能生成具有多个角色、包含特定运动的复杂场景,不仅能理解用户在提示中提出的要求,还了解这些物体在物理世界中的存在方式。

比如一大群纸飞机在树林中飞过,Sora知道碰撞后会发生什么,并表现其中的光影变化。

Sora还可以在单个视频中创建多个镜头,并依靠对语言的深入理解准确地解释提示词,保留角色和视觉风格。

对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

马斯克评OpenAI首个视频生成模型:人类认赌服输

效果

技术方面,目前OpenAI透露的不多,简单介绍如下:

Sora是一种扩散模型,从噪声开始,能够一次生成整个视频或扩展视频的长度,

关键之处在于一次生成多帧的预测,确保画面主体即使暂时离开视野也能保持不变。

与GPT模型类似,Sora使用了Transformer架构,有很强的扩展性。

在数据方面,OpenAI将视频和图像表示为patch,类似于GPT中的token。

通过这种统一的数据表示方式,可以在比以前更广泛的视觉数据上训练模型,涵盖不同的持续时间、分辨率和纵横比。

Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述提示词技术,为视觉训练数据生成高度描述性的标注,因此能够更忠实地遵循用户的文本指令。

除了能够仅根据文本指令生成视频之外,该模型还能够获取现有的静态图像并从中生成视频,准确地让图像内容动起来并关注小细节。

该模型还可以获取现有视频并对其进行扩展或填充缺失的帧,请参阅技术论文了解更多信息(晚些时候发布)。

Sora 是能够理解和模拟现实世界的模型的基础,OpenAI相信这一功能将成为实现AGI的重要里程碑。

奥特曼在线接单

目前已有一些视觉艺术家、设计师和电影制作人(以及OpenAI员工)获得了Sora访问权限。

他们开始不断po出新的作品,奥特曼也开始了在线接单模式。

带上你的提示词@sama,就有可能收到生成好的视频回复。

马斯克评OpenAI首个视频生成模型:人类认赌服输

j截图

下面是更多精彩视频欣赏。

参考链接:[1]https://openai.com/sora

梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI

本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技,36氪经授权发布。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-16 23:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

市场担忧Sora模型带来两大隐患,马斯克“坐不住”了,秀肌肉
...技惊四座”后,在AI领域一向野心勃勃的特斯拉CEO埃隆·马斯克(ElonMusk)“坐不住”了。日前,马斯克发布了特斯拉一年前模拟真实场景的自动驾驶视频,并称“特斯拉视频的生
2024-02-21 14:59:00
马斯克说人类愿赌服输!OpenAI首个文生视频模型炸街,哪些行业又将颠覆
...去时。”有意思的是,就在Sora发布后数小时,特斯拉CEO马斯克就在X平台上接连回复多条帖子“输出”观点。有网友在评论Sora生成的60秒时尚女子在东京街头散步时称
2024-02-16 19:23:00
奥特曼发布“王炸”模型Sora,周鸿祎:中美AI差距再度拉大
...生视频大模型再次让世界感受到了人工智能的强大。就连马斯克也感叹:“人类认赌服输。”OpenAI推新款大模型Sora可根据文本生成60秒视频16日凌晨
2024-02-17 19:43:00
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
...持生成30S逼真视频,网友们直呼不输Luma。抢先看性转版马斯克激情说唱:与Luma一样,目前这个名为Hedra的工具可以免费试用。在给大家带来一手实测前,再来看一波新鲜整活
2024-06-21 11:01:00
马斯克说AI很快就要比人更聪明,靠谱吗?
2017年9月29日,在澳大利亚阿德莱德,埃隆·马斯克在第68届国际宇航大会闭幕式前做主旨演讲。美国知名企业家埃隆·马斯克8日在社交媒体上表示,到明年年底或者2026年,新的人工
2024-04-11 09:57:00
OpenAI在TikTok发布大量Sora生成视频
...ora风”不仅席卷整个科技圈,也在影视圈、游戏圈刷屏,马斯克、周鸿祎、贾扬清等一众科技大佬纷纷下场讨论。马斯克直言:人类要完蛋了。360创始人周鸿祎第一时间发博表示,Sora
2024-02-22 20:39:00
Sora横空出世,马斯克惊叹,网友:工作要丢了
...和模拟之后,会带来新的成果和突破。”Sora横空出世,马斯克惊叹,网友:工作要丢了2月16日凌晨,OpenAI再次扔出一枚深水炸弹
2024-02-17 21:02:00
马斯克:未来两年内AI或将比“最聪明的人类更聪明”【附人工智能行业发展前景预测】
...勋均预测,AGI可能在五年内实现。近日,特斯拉CEO埃隆·马斯克表示,芯片供应短缺在人工智能竞赛中有所缓解,xAI希望在五月份完成对聊天机器人Grok下一版本的培训
2024-04-09 11:24:00
浙大毕业生加入马斯克新AI公司,要探索宇宙真相!
👉👉👉你知道吗?特斯拉创始人埃隆·马斯克最近创立了一个新的人工智能公司,名为xAI,其目标是“了解宇宙的真实本质”。这个团队由12名顶尖的人工智能专家组成,其中有三分之一是华人,
2023-07-16 06:13:00
更多关于国际的资讯: