• 我的订阅
  • 科技

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

类别:科技 发布时间:2024-02-17 21:07:00 来源:财经风云

“两只金毛猎犬在山顶播客”

“火星上日落时的一场极具未来感的无人机比赛”

“在一个与自然和谐共生,同时又有超强朋克气质和高科技属性的未来城市漫游……”

根据上述提示词,OpenAI首席执行官阿尔特曼在X平台上发布了一系列视频,精美的场景让用户惊叹不已。而这些视频全都是通过OpenAI2月15日发布的最新视频生成模型Sora制作的,用户震惊之余,也给予了Sora高度评价,将其描述为“绝无仅有”和“游戏规则改变者”。

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

图片来源:X平台

Sora采用了OpenAI文生图模型DALL-E3背后的强大技术,可将简短的文本描述转化成长达1分钟的高清视频。业界大佬GaborCselle将Sora和Pika、RunwayML和StableVideo进行对比后发现,在输入相同的提示后,其他主流工具生成的视频都大约只有5秒钟,Sora可以在一段长达17秒视频场景中,保持动作和画面一致性。

英伟达人工智能研究院首席研究科学家JimFan也对Sora的能力发出感叹,称这是视频生成领域的GPT-3时刻。他表示,Sora是一个“数据驱动的物理引擎”,一个可学习的模拟器或“世界模型”。360集团创始人、董事长周鸿祎则称,随着Sora的到来,人类离AGI真的就不远了,不是10年、20年的问题,可能一两年很快就可以实现。

在随后发布的技术报告中,OpenAI介绍了Sora的强大性能以及背后的支撑技术,也对Sora的局限性进行了客观的分析。记者通过梳理,总结出了Sora的六大核心优势。

从技术上看,Sora有望将数字内容的创造力和真实感提升到新的水平,但凡事总有两面性,影视、广告制作和视频等行业也将面临严重的冲击。另外,有专家对于技术的迅猛发展也表示出了担忧,称这类技术可能会导致“深度伪造”视频,让人难以识别,产生滥用等问题。技术报告揭秘Sora六大核心优势

值得注意的是,Sora推出的同一天,谷歌发布了Gemini多模态模型的更新版本,而三天前,StabilityAI推出了新的图像生成模型StableCascade。OpenAI的最新举动无疑将加剧生成式AI图片和视频领域的竞争。

而在Sora推出后不久,OpenAI发布了这款新工具的技术报告。在报告中,OpenAI首先重点介绍了如何将不同类型的视觉数据转化为统一的格式,以便于对生成模型进行大规模训练的方法,并对Sora的能力和局限性进行了评价。

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

图片来源:Sora技术报告

记者经过对报告的梳理,总结出了Sora的6大优势:

(1)准确性和多样性:Sora可将简短的文本描述转化成长达1分钟的高清视频。它可以准确地解释用户提供的文本输入,并生成具有各种场景和人物的高质量视频剪辑。它涵盖了广泛的主题,从人物和动物到郁郁葱葱的风景、城市场景、花园,甚至是水下的纽约市,可根据用户的要求提供多样化的内容。另据Medium,Sora能够准确解释长达135个单词的长提示。

(2)强大的语言理解:OpenAI利用Dall-E模型的re-captioning(重述要点)技术,生成视觉训练数据的描述性字幕,不仅能提高文本的准确性,还能提升视频的整体质量。此外,与DALL·E3类似,OpenAI还利用GPT技术将简短的用户提示转换为更长的详细转译,并将其发送到视频模型。这使Sora能够精确地按照用户提示生成高质量的视频。

(3)以图/视频生成视频:Sora除了可以将文本转化为视频,还能接受其他类型的输入提示,如已经存在的图像或视频。这使Sora能够执行广泛的图像和视频编辑任务,如创建完美的循环视频、将静态图像转化为动画、向前或向后扩展视频等。OpenAI在报告中展示了基于DALL·E2和DALL·E3的图像生成的demo视频。这不仅证明了Sora的强大功能,还展示了它在图像和视频编辑领域的无限潜力。

(4)视频扩展功能:由于可接受多样化的输入提示,用户可以根据图像创建视频或补充现有视频。作为基于Transformer的扩散模型,Sora还能沿时间线向前或向后扩展视频。从OpenAI提供的4个demo视频看,都从同一个视频片段开始,向时间线的过去进行延伸。因此,尽管开头不同,但视频结局都是相同的。

(5)优异的设备适配性:Sora具备出色的采样能力,从宽屏的1920x1080p到竖屏的1080x1920,两者之间的任何视频尺寸都能轻松应对。这意味着Sora能够为各种设备生成与其原始纵横比完美匹配的内容。而在生成高分辨率内容之前,Sora还能以小尺寸迅速创建内容原型。

(6)场景和物体的一致性和连续性:Sora可以生成带有动态视角变化的视频,人物和场景元素在三维空间中的移动会显得更加自然。Sora能够很好地处理遮挡问题。现有模型的一个问题是,当物体离开视野时,它们可能无法对其进行追踪。而通过一次性提供多帧预测,Sora可确保画面主体即使暂时离开视野也能保持不变。

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

图片来源:Sora技术报告

据外媒报道,Sora的推出标志着AI研究的一个重要里程碑。凭借其模拟和理解现实世界的能力,Sora为未来实现通用人工智能(AGI)奠定了基础。从本质上讲,Sora不仅仅是生成视频,而是在突破AI所能完成的极限。

伊利诺伊大学厄巴纳-香槟分校信息科学教授TedUnderwood表示:“就算是在未来的2-3年,我也没想过视频制作可以达到这样持续、连贯的水平。”他表示,与其他文本到视频工具相比,“容量似乎有所提升”。

OpenAICEO阿尔特曼在X平台上透露,Sora目前已向红队成员(redteamers,指的是误导信息、仇恨内容和偏见内容等方面的专家)和部分创意人士开放。业内人士:Sora可能让AGI在1年左右实现

英伟达人工智能研究院首席研究科学家JimFan则在X平台发文表示,“如果你还是把Sora看成DALLE那样的生成式玩具,还是好好想想吧,这是一个数据驱动的物理引擎。他是对许多世界的模拟,无论是真实的还是幻想的。”他认为,Sora是一个可学习的模拟器,或“世界模型”。

在他看来,Sora代表了文本生成视频的GPT-3时刻。而针对部分称“Sora并没有学习物理,仅仅是在二维空间里对像素进行操作”的声音,他表示,Sora所展现的软物理仿真实际上是一种随着规模扩大而出现的特性。Sora必须学习一些隐式的文本到3D、3D变换、光线追踪渲染和物理规则,才有可能精确地模拟视频像素。它必须理解游戏引擎的概念,才有可能生成视频。

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

图片来源:X平台

在前女友格莱姆斯的一条推文下方,马斯克回应称:“有了AI加持的人类将在未来几年里创造出最好的作品。”格莱姆斯在X平台上发布了多条推文,讨论OpenAI这项新技术对电影以及更广泛的艺术创作的影响。此外,有网友在评论Sora生成的60秒时尚女子在东京街头散步时称,“ggPixar(皮克斯动画制作公司)”(编注:gg为GoodGames缩写,代指“打得好,我认输”),随后马斯克回复,“gghumans(人类)”。

技术报告揭秘Sora六大核心优势,影视等行业面临颠覆

图片来源:X平台

对于Sora的最大优势,360集团创始人、董事长周鸿祎说,“这次OpenAI利用它的大语言模型优势,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。”他同时称,“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习,一幅图胜过千言万语,这就离AGI真的就不远了,不是10年、20年的问题,可能一两年很快就可以实现。”影视等行业面临颠覆

然而,Sora在带来无限可能的同时,也将对部分行业产生巨大的影响,包括影视、广告制作、教育、游戏、新闻和动画等领域。

谈及Sora的行业冲击时,JimFan评价道,Sora的物理学理解目前还是脆弱的,远非完美。它仍然会产生幻觉,生成与物理常识不符的事物,还没有很好地掌握物体交互的原理。

周鸿祎对此也深以为然,他指出,AI不一定那么快颠覆所有行业,但它能激发更多人的创作力。他表示,“Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。”

他解释说,“机器能生产一个好视频,但视频的主题、脚本和分镜头策划、台词的配合,都需要人的创意至少需要人给提示词。”他强调,科技竞争最终比拼的是人才密度和深厚积累。

而对于Sora当前存在的弱点,OpenAI也明确指出,它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹。而这些缺陷可能导致Sora生成一些不合逻辑的东西,比如一个人在跑步机上跑错方向,以不自然的方式改变主题,甚至出现凭空消失的现象。滥用仍是最大的担忧

随着名人、政客等人物的深度造假视频在网上变得越来越普遍,相应的伦理和安全问题也让人心惊,尤其是在总统选举年和紧张的政治局势背景下。

Gartner分析师ArunChandrasekaran表示,“鉴于这项技术确实非常新,他们必须对其进行充分控制,以防止其被滥用和误用,甚至客户在没有认识到这项新兴技术所有局限性的情况下使用它。”他补充道,OpenAI为该模型设置的防护措施以及确定谁可以获得访问权限至关重要。

牛津互联网学院客座政策研究员MutaleNkonde也表示,任何人都可以轻松地将文本转换为视频这一想法令人兴奋。但同时,她也担心这些工具可能会植入社会偏见和仇恨内容,对人们生计造成影响等。

普林斯顿大学计算机科学教授ArvindNarayanan对此也有担忧,认为Sora这类技术可能会导致“深度伪造”视频,让人们难以识别。虽然AI制作的视频仍会有一些不一致的地方,但普通人可能不会注意到这些细节。“迟早,我们需要适应现实主义不再是真实性的标志这一事实。”

针对业界的担忧,与此同时,监管机构也在加强管理。美国联邦贸易委员会(FTC)2月15日提出了禁止使用AI工具冒充个人的规则。FTC表示,它正在提议修改一项已经禁止冒充企业或政府机构的规则,将保护范围扩大到所有个人。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-18 00:45:03

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

专访首部AI短剧《白狐》操盘者蔺志强:拥抱变化,押注未来
...带来极大的创作乐趣。“总而言之,制作《白狐》是一个颠覆思维模式的过程。”蔺志强如是说。2超级创作者有望出现商业化问题必须直面直观来说,AIGC确实降低了制作门槛,但更重要的是
2024-03-22 17:50:00
《默杀》成票房黑马,猫眼拿下暑期档第一爆
...、观影地区分布等,及时调整宣发策略,做到精准营销,颠覆了传统的电影发行模式。 《心花路放》累计超过11亿的总票房中,猫眼贡献了半数,同一年末上映的《智取威虎山》以8.83亿
2024-07-12 19:11:00
左手AIGC,右手IP,阅文到了关键时刻
...Sora带来的AIGC视频能力是对过往视觉娱乐生产模式的一种颠覆,仅仅从成本角度出发,原本影视作品中所需要的表演者、服化道、视频剪辑等因素,会直接被AI算力做出取代。于是,一
2024-03-20 17:39:00
元客视界助力媒体产业转型升级
...聚全球顶尖行业领袖与前沿企业,围绕AIGC为内容生产的颠覆性变革、业务模式的创新实践,以及数字创意领域的最新趋势进行深度交流与思想碰撞。数字内容产业飞速发展,内容力已成为衡量
2024-05-29 11:57:00
视听平台成影视人才孵化沃土,虎鲸文娱“春苗计划”构建平台型人才培养模式
...创作者成长。优酷副总裁刘燕红视听平台成为“首机会”核心供给方影视行业吸引力大,相关岗位竞争激烈,头部效应挤压,行业新人的作品能“被看到”并不容易。报告显示,视听平台已逐渐成为
2025-06-25 20:52:00
120万字小说15分钟读完?傅斌星委员:让AI+应用提升浙企竞争力
...可能会发生变化,“新技术浪潮将对影视等多个行业产生颠覆性的影响。”事实上,对大部分中小企业而言,现阶段要拥抱AIGC,以华策的实践来看,傅斌星建议重点考虑应用型能力的开发,立
2024-01-25 23:34:00
三年稳居榜首,华为折叠屏旗舰热度不减,技术优势一代比一代领先
...化达成共识。在这一过程中,折叠屏手机凭借崭新形态和颠覆性体验,热度持续攀升,出货量从2020年以来始终逆势增长,2022年更是同比暴增154
2023-03-16 10:50:00
成龙变年轻 吴京说外语 AI是否会颠覆影视行业?
1905电影网专稿近日,网友使用AI技术复活、、等逝世明星行为,引发网友热议。乔任梁父亲和高以翔家人隔空喊话相关博主,要求下架有关视频。在此之前,利用AI技术复活女儿感动了很多普
2024-03-19 13:49:00
59秒视频质量媲美“大片”,颠覆影视行业?Sora能吗
...ora“可能给广告业、电影预告片、短视频行业带来巨大的颠覆”,并且认为OpenAI“手里的武器并没有全拿出来”“AGI不是10年
2024-02-27 18:45:00
更多关于科技的资讯:
出海的隐性分水岭:中小企业开始直面“品牌能力”的考验
过去几年,中国中小企业的出海进程明显提速。从新能源、智能制造到各类工业技术与解决方案型企业,越来越多公司完成了将产品推向海外市场的第一步
2026-02-24 17:15:00
服务人次958万,云迹科技机器人服务智能体全力保障春节
2026年春节期间,人工智能与具身智能技术深度融入大众节日生活,展现出从“可选项”向“必需品”转变的显著趋势。在酒店、景区
2026-02-24 17:18:00
海辰储能山东一体化零碳产业园将于二季度试生产— 一场瞄准AI时代的能源“卡位战”
鲁网2月24日讯除夕夜,黄宣田在菏泽学会了包饺子。作为厦门海辰储能科技股份有限公司(以下简称“海辰储能”)菏泽制造基地负责人
2026-02-24 17:28:00
25000㎡、300+品牌、20000+买家:亚洲户外烧烤展5月定档广州,打造全球户外生活商贸枢纽
随着露营经济等消费趋势兴起,消费者对高品质、体验式户外生活的需求日益增长,全球掀起一股烧烤热潮。从家庭聚会到户外派对,烧烤不再只是厨房的延伸
2026-02-24 17:51:00
庙会上的科技范儿
科技庙会上机器人在给市民免费送年货。机器人“店小二”在售卖饮品。机器人在和小朋友“智对诗章”。机器人舞狮表演吸引众多游客围观
2026-02-24 14:56:00
新春之际,年货市场掀起新潮流。AI眼镜、陪伴机器人、无弦吉他成为抢手货,3D打印机现做生肖模型、智能书法台挥毫送福成新景
2026-02-24 14:56:00
大麦娱乐灯塔研究院春节档洞察:总票房57.52亿,三四线城市票房近53%
2月24日,大麦娱乐旗下灯塔研究院发布《2026年春节档电影市场洞察报告》。报告显示,2026年春节档总票房达57.52亿
2026-02-24 14:58:00
理解“长途优先”背后的平衡智慧
这两天,“长途有票、短途无票”的话题在网络上引发了不少讨论。不少旅客感到困惑:明明同一趟车,为什么长途票能买到短途票却显示“无票”
2026-02-24 15:11:00
中国消费者报讯(记者万晓东)近日,谦寻控股在《直播电商监督管理办法》(以下简称《办法》)出台后积极组织全员开展专题学习
2026-02-24 15:26:00
稻米品质评价及智慧栽培优化
水稻是全球最重要的粮食作物之一,世界近半数人口以稻米为主食。中国是世界第一大稻米生产国与消费国,三分之二人口以稻米为主粮
2026-02-24 15:40:00
大润发贺新年:以实惠为笔,绘就万家团圆暖色调
岁末年初,新春的烟火气裹挟着期待在街巷蔓延。作为民生消费的核心阵地,大润发紧扣“年味”脉搏,以覆盖生鲜、年货、零食、礼品的惠民折扣
2026-02-24 11:27:00
万马奔腾越山海|听,这是潍柴雷沃海外人的“新春奋进曲”
鲁网2月24日讯新春团圆时,奋斗不停歇。当祖国大地张灯结彩欢度春节,潍柴雷沃海外人依然在异国他乡默默坚守,用奋斗奏响一曲昂扬的“新春奋进曲”
2026-02-24 11:28:00
新年伊始,深谋发布震撼拜年视频,以其大载重eVTOL飞行器为“筋斗云”,搭载具身智能人形机器人“美猴王”腾云驾雾的空中拜年视频
2026-02-24 11:32:00
新年复工迎客流高峰:老字号珠宝定制热潮迭起 三大升级马年启新章
“哈哈,不到九点,你们店还没开门,我们就到了”,子冈珠宝定制坊苏州总店新年第一位顾客说。为此店长为这位总店马年首位顾客送上普陀山书院文创伴手礼
2026-02-24 13:01:00
春晚宇树四分半:全球人形机器人一哥的功夫梦
这已经是宇树机器人第三次亮相春晚,我们却感到了前所未有的震撼。今年的央视春节联欢晚会上,还是那家全球领先的宇树科技,把舞台当成了新技术的展示场
2026-02-24 12:04:00