• 我的订阅
  • 财经

Sora刷屏视频出现多处失误 模拟真实世界仍需闯关

类别:财经 发布时间:2024-02-19 09:37:00 来源:第一财经
Sora刷屏视频出现多处失误 模拟真实世界仍需闯关

2月18日,由OpenAI 发布的文生视频AI工具Sora引发的讨论仍在继续,范围涉及科技圈、资本圈、影视圈等,同时对Sora尚存在的问题研究也逐渐深入。

例如针对OpenAI定位“世界模拟器”的观点,图灵奖得主、Meta首席AI科学家杨立昆(YannLeCun)表示,根据提示词生成的大部分逼真视频并不表明这样的AI系统理解物理世界,生成视频的过程与基于世界模型的因果预测完全不同。

翻阅OpenAI披露的数十份视频,杨立昆的观点具体表现为老奶奶吹蜡烛火苗却不动、东京街头步伐错误的女郎、玻璃杯碎后错误的液体流向、在跑步机上反向跑步的男子等。

虽然OpenAI的明星效应为其带来大量关注,同日谷歌发布的多模态通用模型Gemini 1.5 Pro也变为配角,但不论是美国硅谷AI项目还是中国大模型创业公司,外界关注的核心均为实际应用效果。

视频虽惊艳bug仍存在

目前,Sora所生成的视频内容得到影视行业人士的普遍认可。Mystery Novel视觉预演工作室创始人、导演牛萌琛对第一财经记者表示,Sora视频中的画质,画面内容中的细节、光影、色彩都较精细,对导演来说,为其在拍摄前期做一个简单的镜头样板是够用的。对广告片拍摄来说,也可以用这种样板来与客户更好地进行概念上的沟通和确认。但如果涉及镜头运动角度,与更精细内容调控——如色彩、光影、道具、人物动作等,目前AI还不能达到令客户满意的程度。

一位纪录片从业者对记者表示,目前Sora还不能直接用于影视作品,因为精细度还不够。但已经足够震撼,完全可以用于前期开发,尤其是概念设计。一位宣传片从业者表示,工作室目前还没试过用AI生成来做素材,Sora 只发布了部分作品,且未开放公测,能不能用来代替剪辑不确定。无论如何,这些工具最后都是为人服务的,人的个人感情复杂性的表达不可替代。

摄影专业人士孟凡对记者表示,Sora视频帧率较高,说明计算能力比较强,且影片的宽容度更高,如调色、细节表现、高速镜头展现等。在直观感受上,Sora 模型产出的视频运镜自然,物体运动符合规律,镜头间逻辑一致性好,但是Sora视频的逻辑性会差一点。

具体表现在Sora视频内容中,如一分钟的东京街头女郎漫步,女郎走路过程中存在腿部变形、腿部交叉换位时错乱、右腿连续两次在前方迈步等错误;一段提示词为“一个人跑步的场景”中,主角在跑步机上反向奔跑;提示词为“考古学家在沙漠发现塑料椅子”的视频中,椅子呈现悬浮状态。

针对目前Sora存在的不成熟之处,OpenAI表示,Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系,可能混淆提示的空间细节,可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹等。

OpenAI方面在《作为世界模拟器的视频生成模型》技术报告中表示,Sora作为一个模拟器,目前表现出许多限制,它并没有准确地模拟许多基本互动的物理效应,比如玻璃破碎。吃食物之类的互动不总是产生正确的物体状态变化。还有在长时间样本中发展的不连贯性或物体的自发出现。

对于这些问题,多位人工智能领域人士对记者表示,皆因概率模式的逻辑硬伤所致。中科深智创始人兼CEO成维忠表示,Sora因其并非严格的推理模型,目前还存在因果关系推理问题,但这个问题不是Sora自身的问题,而是目前所有类似模型均存在的问题,类似于大模型普遍存在的幻觉问题。未来会随着训练的加强而得到改善。

宜远智能CEO吴博对记者表示,通过加大训练量、增加训练数据与物理逻辑,该问题会逐渐得到改善,但无法根治。

南洋理工大学副教授张含望此前在GAIR全球人工智能与机器人大会上表示,想要真正突破最底层逻辑上的问题,因果关系(Causality)是一条必经之路。如果不把因果关系加上去,大模型只是在进行强行关联,幸运的话,模型在回答问题时能够给出正确答案,否则就会“胡说八道”。这是因为它背后的关联是错误的——把共生关系当成了因果关系。

实际使用价值待解

Sora之所以能引发广泛关注,除了画面超过同行的质量原因外,更在于外界对其即将带来的行业迭代充满好奇。

就影视行业而言,得知Sora视频发布后,时光矩阵联合创始人郁刚称自己的心态冰火两重天,一方面对于影视特效公司而言,该消息算不上一个好消息,自己第一个感觉是“特效公司要死了吗?”很想将过去学的特效工具“埋了”。

郁刚称自己过去能想象到AI视频会发展到这个精度,但没有想过会这么快,其原本的预测时间是三到五年,结果在一年时间内就达到——从兔年春节到龙年春节,OpenAI实现了从文生文到文生视频的迭代。但从另一个角度来说,郁刚称自己很欣喜,从导演角色来说,过去最痛苦的就是拿到剧本之后找钱、找投资方,开了四年公司,账上亏损欠账三百万人民币,但看了Sora之后,拍视频、做成特效并放到荧幕上这步最贵的动态预演环节,完全可以通过AI实现成本节省。

郁刚预计,未来AI视频生态将发生巨大变化,影视行业或将变为服务业,视频生产的概念也将发生变化。

专业动画师Owen Fern不认可当下“Sora颠覆行业”的极端观点,他称,作为一名动画师,目前并不对Sora视频感到害怕,因为动画制作本质上是需要反复修正的过程,特别是在为客户服务时更是如此。目前 AI 还无法提供给客户一个精雕细琢的作品,而只是一些粗制滥造的东西。这些细节看似挑剔,但它们正是客户对知识产权(IP)或产品所持的态度。

Owen Fern强调称,Sora视频的质量的确是令人惊叹的高,只是就目前而言,它们除了作为展示AI潜力的范例作用外,实用价值仍待观察。

新加坡Vibranium Consulting副总裁陈沛近期实际使用和观察了RunwayML、Stable Video Diffusion(SVD)、Adobe Firefly等主流AI视频服务,通过对比发现,目前AI生成视频的质感往往达不到最初宣传的效果,还会在物体行进方向、人物四肢等方面出现明显错误,无法满足实际应用的需求。

Perplexity AI 创始人之一的Aravind Srinivas表示,Sora虽然令人惊叹,但其还没有做好准确模拟物理的准备——正如Sora研究员在报告中提及的那样。并且,行业并不能很快地在家庭清洁机器人上运行这些巨大的“世界模拟器”的模拟推理。

浙商证券认为,短期内,Sora及同类产品可大幅提升图像和短视频的制作效率,改变创意生产及营销工作流,提升短视频产品生产力。对于业态更加复杂的长视频和游戏,受限于模型还无法准确理解因果关系及其他技术难点,现阶段或以提供美术灵感支持为主。

中长期来看,浙商证券表示,Sora及同类产品将参与到改变信息生产和分发两大环节的进程中,PGC(专业生产内容)将广泛采用AI工具辅助生产,UGC(用户生成内容)将借助AI 工具逐步替代PGC。此间,AI生成视频工具的商业化将提速。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-19 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...能难以准确地模拟复杂场景的物理表现,也可能无法理解因果关系的具体实例,并举例称,视频很可能会出现一个人咬了一口饼干后,饼干上没有咬痕。同时,该模型还可能混淆诸如左和右这类的空
2024-02-17 10:02:00
外媒体验Sora:猴子长出鹦鹉尾巴,OpenAI称还有很长路要走
...能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。还可能会混淆提示的空间细节,例如混淆左右,并且可能
2024-02-23 20:09:00
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...素的任务需求,同时为了加强连续视频帧之间事件的时间因果关系,引入了带有特殊因果掩码的因果自注意结构。 MRC Q-Former结构首先
2024-08-01 09:45:00
OpenAI新作Sora:完美模拟真实世界,现可生成1分钟视频
...局限性,如难以准确模拟复杂场景的物理原理、无法理解因果关系等。尽管如此,在视觉艺术家、设计师和电影制作人(以及OpenAI员工)获得访问权限后,已经开始不断创作新的作品展示A
2024-02-16 13:00:00
openai首个视频生成模型sora正式发布
...能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。输入“穿过东京郊区的火车窗外的倒影”后Sora生成的视频据了解,Sora可以一次性生成整个视频,也可以扩展生成的视
2024-02-16 19:06:00
阿里开源版Sora上线即屠榜 4070就能跑 免费商用
...了3D变分自动编码器,这是一种专门为视频生成设计的3D因果关系体系结构。 它在卷积模块中实现了特征缓存机制,并结合了多种策略来改善时空压缩,减少记忆使用情况并确保时间因果关
2025-02-26 20:05:00
自动驾驶领域 Sora大有可为
...难以准确地模拟复杂场景的物理特性,并且可能无法理解因果关系,也会混淆左和右等。”“正如ChatGPT4令人惊讶其聪明,但深入仔细研究时,事情就有些崩溃,它更多是存在某些特定背
2024-02-22 04:06:00
假如Sora应用于军事
...当有了足够的数据和算力,Sora或将对现实世界的物理、因果关系和逻辑关系等有更深刻的理解,进而引领人工智能领域向更高水平发展,对各领域各行业产生更加深刻的影响。
2024-04-19 05:20:00
OpenAI发布首个文生视频模型Sora,网友:工作要丢了!
...能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。该模型还可能混淆提示的
2024-02-16 18:20:00
更多关于财经的资讯:
科技赋能 装备美好丨山东重工·潍柴动力全球合作伙伴大会在青岛召开
10月18日,以“科技赋能 装备美好”为主题的山东重工·潍柴动力全球合作伙伴大会在青岛红岛国际会展中心盛大启幕。青岛市委副书记
2025-10-19 10:25:00
2025年全国农产品产销大会|龙大哥辣子鸡创始人李顺利:用美味干锅传递贵州热情
“贵州干锅,以‘干香’为魂,‘热辣’为韵,讲究食材先炒后煮,其味道浓郁奔放,完美展现了贵州人热情豪爽的性格特质。”10月17日
2025-10-19 10:55:00
贵阳花溪区职业指导进校园系列活动助力毕业生扬帆起航
10月16日,“花式引才·溪望你来”2025年花溪区职业指导进校园系列活动走进贵阳人文科技学院。活动特邀职业指导专家武星为该校经济与管理学院2026届198名毕业生开展专题授课
2025-10-19 14:02:00
2025年全国农产品产销大会丨“老凯俚酸汤鱼”创始人丁文建:用酸汤传递贵州的纯粹与自然
“‘三天不吃酸,走路打蹿蹿。’这句话生动道出了贵州人对酸汤的深厚情感。”10月17日,在贵州“三锅演义”生态黔菜推介会上
2025-10-19 14:02:00
2025年全国农产品产销大会丨夏光忠:走出一条具有“六枝”辨识度的土特产“出山路”
“立志把农产品电商做到极致,通过不断优化运营模式,提升服务质量等,走出一条具有‘六枝’辨识度的土特产出山之路,将小黄姜
2025-10-19 14:03:00
贵阳花溪区举办高校毕业生入企体验活动
10月15日,花溪区人力资源和社会保障局举办“助力攻坚·就创青春”2025年高校毕业生入企体验活动。本次活动组织区内30名高校毕业生等青年人才走进辖区企业
2025-10-19 14:03:00
2025全国农产品产销大会丨黄庆满:让一杯贵州牛奶走进千家万户
“我们今年的目标是直播团队实现销售额5000万元,让更多消费者通过一杯贵州牛奶,认识贵州、信任贵州、爱上贵州。”10月18日
2025-10-19 14:03:00
“以前要跑好几趟,现在服务到身边”|回眸“十四五”·高质量发展这五年
日前,德耐尔节能科技公司贵阳分公司负责人手握一纸证明,欣喜之情溢于言表:“7个工作日,超乎预料。”通过南明区“企业上市合法合规信息核查一件事”服务
2025-10-19 21:50:00
2025年全国农产品产销大会丨省商务厅副厅长朱霖毅:开拓黔菜产业高质量发展蓝海
“‘生态黔菜·美味健康’不仅是一句口号,更是一个巨大的市场机遇和一份沉甸甸的产业邀请。我们热切期待,以本次产销大会为纽带
2025-10-19 14:03:00
今年1-9月 厦门开具发票销售金额同比增长7.17%
厦门网讯(厦门日报记者 陈泥 通讯员 徐然)厦门市税务局发布的最新税收数据显示,今年1—9月,全市开具发票销售金额同比增长7
2025-10-18 08:59:00
前三季度福建对其他金砖国家出口破千亿元
【我省深挖“金砖”商机】民营企业成“主力军”前三季度,福建省民营企业对其他金砖国家出口725.9亿元,同比增长7.8%
2025-10-18 08:59:00
港口航运板块“抢滩”风口 相关概念股热度升温
近日,港口航运股逆市走强,成为A股市场亮点之一。板块内多只概念股持续活跃,中远海特、招商南油股价均连续三周收红。业内人士认为
2025-10-18 10:41:00
边风炜:调整很正常 但也很煎熬
本周市场迎来调整,或者不应该叫调整,说震荡更合理,因为上证指数几乎没有跌,一度还临近前高,不过双创指数跌了一些,整体市场投资者的感受不太好
2025-10-18 10:41:00
党建引领 金融护航:青岛农商银行十二条举措全力守住“粮袋子”
深秋时节,本是丰收喜悦之时,连绵秋雨却给秋收工作增添了挑战。农田积水、粮食存储环境潮湿、后续生产资金短缺等问题接踵而至
2025-10-18 12:06:00
2025沙特·中国—工业与建材展成功举办
10月12日至15日,由山东省商务厅、山东省贸促会联合主办的2025沙特·中国—工业与建材展在沙特阿拉伯王国首都利雅得国际会展中心成功举办
2025-10-18 12:40:00