• 我的订阅
  • 科技

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

类别:科技 发布时间:2024-02-16 18:44:00 来源:财经风云

2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

一位时髦女士漫步在东京街头,周围是温暖闪烁的霓虹灯和动感的城市标志。

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

一名年约三十的宇航员戴着红色针织摩托头盔展开冒险之旅,电影预告片呈现其穿梭于蓝天白云与盐湖沙漠之间的精彩瞬间,独特的电影风格、采用35毫米胶片拍摄,色彩鲜艳。

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

竖屏超近景视角下,这只蜥蜴细节拉满:

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI表示,公司正在教授人工智能理解和模拟运动中的物理世界,目标是训练出能够帮助人们解决需要与现实世界互动的问题的模型。在此,隆重推出文本到视频模型——Sora。Sora可以生成长达一分钟的视频,同时保证视觉质量和符合用户提示的要求。

OpenAI创始人兼CEOSamAltman(奥尔特曼)太会玩了,让网友评论回复Prompt(大语言模型中的提示词),他选一些用Sora生成视频。截至发稿,奥尔特曼连发多条根据网友提示词生成的视频,包括不同动物在海上进行自行车比赛、发布自制面疙瘩烹饪教学视频的祖母、两只金毛犬在山顶做播客、日落时分火星上进行的一场无人机竞赛等。但这些视频时长为9秒至17秒不等。

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词

技术层面,Sora采用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力机制,可以使用更少的算力,生成高分辨率图像。此前Midjourney与StableDiffusion的图像与视频生成器同样基于扩散模型。

同时,Sora也存在一定的技术不成熟之处。OpenAI表示,Sora可能难以准确模拟复杂场景的物理原理,可能无法理解因果关系,可能混淆提示的空间细节,可能难以精确描述随着时间推移发生的事件,如遵循特定的相机轨迹等。

根据OpenAI关于Sora的技术报告《Videogenerationmodelsasworldsimulators》(以下简称报告),跟大语言模型一样,Sora也有涌现的模拟能力。

OpenAI方面在技术报告中表示,并未将Sora单纯视作视频模型,而是将视频生成模型作为“世界模拟器”,不仅可以在不同设备的原生宽高比直接创建内容,而且展示了一些有趣的模拟能力,如3D一致性、长期一致性和对象持久性等。目前Sora能够生成一分钟的高保真视频,OpenAI认为扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。

报告指出,OpenAI研究了在视频数据上进行大规模训练的生成模型。具体而言,联合训练了文本条件扩散模型,该模型可处理不同持续时间、分辨率和长宽比的视频和图像。OpenAI利用了一种基于时空补丁的视频和图像潜在代码的变压器架构。最大的模型Sora能够生成一分钟的高保真视频。结果表明,扩展视频生成模型是构建通用物理世界模拟器的有前途的途径。

报告重点介绍了OpenAI将各类型视觉数据转化为统一表示的方法,这种方法能够对生成模型进行大规模训练,并对Sora的能力与局限进行定性评估。先前的大量研究已经探索了使用多种方法对视频数据进行生成建模,包括循环网络、生成对抗网络、自回归转换器和扩散模型。这些研究往往只关注于狭窄类别的视觉数据、较短的视频或固定大小的视频。而Sora是一个通用的视觉数据模型,它能够生成跨越不同时长、纵横比和分辨率的视频和图像,甚至能够生成长达一分钟的高清视频。

OpenAI从大型语言模型中汲取灵感,这些模型通过训练互联网规模的数据获得通用能力。LLM范式的成功在一定程度上得益于令牌的使用,这些令牌巧妙地统一了文本的不同模式——代码、数学和各种自然语言。在这项工作中,OpenAI考虑视觉数据的生成模型如何继承这些优势。虽然LLM有文本令牌,但Sora有视觉补丁。之前已经证明,补丁是视觉数据模型的有效表示。补丁是一种高度可扩展且有效的表示,可用于在多种类型的视频和图像上训练生成模型。

Sora支持采样多种分辨率视频,包括1920x1080p的宽屏视频、1080x1920的竖屏视频以及介于两者之间的所有分辨率。这使得Sora能够直接以原生纵横比为不同的设备创建内容。同时,它还允许在生成全分辨率内容之前,使用相同的模型快速制作较小尺寸的内容原型。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-16 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Sora终于要来了?OpenAI放出“王炸”,奥尔特曼透露:AI智能体有望明年实现,AGI的到来将比大多数人预期的早
...,期间会放出“一大堆新事物”。OpenAI首席执行官山姆·奥尔特曼(Sam Altman)补充说,每个工作日,OpenAI都会有一场直播
2024-12-06 18:09:00
比赛开始了!Sora对手直呼奥特曼是魔术师,创意行业最先受冲击?
AI(人工智能)新锐巨头OpenAI近日推出文生视频模型Sora,成为了继聊天机器人ChatGPT之后又一大新爆款。在Sora官网上
2024-02-18 18:30:00
OpenAI取消独立发布o3模型 未来将推出整合多项技术的GPT-5
...三(2月12日),人工智能(AI)研究公司OpenAI首席执行官奥尔特曼宣布,OpenAI将在未来几个月内推出名为GPT-5的模型
2025-02-13 07:20:00
奥尔特曼X上发“草莓” 网友疯狂猜测:这难道是GPT新模型
ChatGPT开发商OpenAI的首席执行官山姆·奥尔特曼(Sam Altman)在社交媒体X上发布了一张花园里自种草莓的照片后
2024-08-08 18:41:00
...迹堪称奇迹,相信OpenAI将在现任首席执行官(CEO)萨姆·奥尔特曼等人的领导下,打造安全有益的通用人工智能(AGI)
2024-05-17 04:05:00
微软CEO在2024财年获得价值7910万美元的总薪酬;奥尔特曼辟谣OpenAI新模型消息|Do早报
...于上市公司股东的净利润为608.28亿元,同比增长15.04%。【奥尔特曼辟谣OpenAI新模型消息】有消息称OpenAI计划推出其下一个前沿模型Orion
2024-10-26 14:33:00
OpenAI凌晨放王炸!GPT-5即将发布 免费无限使用
快科技2月13日消息,北京时间今天凌晨,OpenAI CEO萨姆·奥尔特曼(Sam Altman)放出“王炸”级别更新预告
2025-02-13 07:20:00
OpenAI CEO承认了!DeepSeek非常棒 不会起诉
当地时间2月3日,ChatGPT开发商OpenAI联合创始人兼CEO山姆·奥尔特曼(Sam Altman)在日本东京接受媒体采访时表示
2025-02-04 13:41:00
...智能研究中心”(OpenAI)17日在官网发布公报说,萨姆·奥尔特曼辞去首席执行官一职并退出董事会,公司首席技术官米拉·穆拉蒂担任临时首席执行官。公报说,奥尔特曼离职是董事会
2023-11-19 00:57:00
更多关于科技的资讯:
全民可感可玩可参与!2025北京机器人文化节落幕,昌平区打造沉浸式体验推动机器人产业场景融合
10月2日,由iCANX全球科学平台主办的“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇顺利落下帷幕
2025-10-10 14:59:00
合作再升级 阿维塔完成向华为115亿投资支付
阿维塔给华为打了34.5亿,这是第三笔投资款,算下来阿维塔前后一共给了115亿,现在这笔钱全付清了,这意味着阿维塔正式拿到了华为引望10%的股份
2025-10-10 12:16:00
记者10月9日获悉,国家发展改革委、市场监管总局近日发布《关于治理价格无序竞争维护良好市场价格秩序的公告》,提出在保护经营者自主定价权的前提下
2025-10-10 12:20:00
中新经纬10月10日电 题:京东为啥也要卖咖啡?作者 朱丹蓬 广东省食品安全保障促进会副会长、中国食品产业分析师随着消费者对“即买即得”需求的日益增长
2025-10-10 12:23:00
虎鲸文娱发布《2025国庆假期文娱消费报告》票房火热 大屏“圈粉”南报网讯(记者鲁舒婷)10月8日,虎鲸文娱发布的《2025国庆假期文娱消费报告》(以下简称《报告》)显示
2025-10-10 07:32:00
名创优品MINISO深耕IP战略:岭南骑楼店开业首日引爆Z世代消费热潮
2025年8月17日,名创优品MINISO LAND华南首店于广州北京路步行街正式开业。该店以百年岭南骑楼为空间载体,融合超过100个全球热门IP
2025-10-09 11:15:00
荣耀Magic8系列发布会官宣定档10月15日
10月9日,荣耀官方正式宣布,主题为“开新局・见未来”的荣耀 Magic8 系列暨 Magic OS10 发布会将于10 月15日正式举行
2025-10-09 11:30:00
局部降水量80毫米以上!10—14日烟台市将有持续连阴雨天气
齐鲁晚报·齐鲁壹点 周宣刚10月7日10时,烟台市气象局发布10—14日连阴雨天气预报和大风警报。受高空槽东移和暖湿气流输送北上的水汽影响
2025-10-09 11:31:00
权威发布, 福瑞达颐莲品牌价值评估突破120亿
2025年9月25日,在中国香料香精化妆品工业协会主办的“2025中国香妆品牌价值大会”上,福瑞达生物股份旗下颐莲品牌凭借卓越的市场表现与品牌影响力
2025-10-09 11:32:00
持续创新高!高德扫街榜上线23天用户超4亿
这个国庆黄金周,高德APP和高德扫街榜正在持续创新高——10月3日,高德扫街榜宣布:上线仅23天,累计用户超4亿。10月1日
2025-10-09 11:33:00
国庆中秋,大马再掀中餐热潮!“鱼你速度”树出海标杆!
国庆中秋双节期间,马来西亚再度掀起中餐热潮!以“鱼你在一起”为代表的中餐连锁品牌,在当地各大商圈持续引爆消费热情。“6个月
2025-10-09 11:34:00
开启商超智慧储鲜,澳柯玛新品冷柜让食材更鲜活
鲁网10月9日讯当社区团购爆单时冰柜塞不下?当生鲜进货量太大冻不透?当网红雪糕因串味被迫贱卖?针对这些让商超、饭馆等用户抓狂的痛点
2025-10-09 11:40:00
鸡排哥8天假期涨粉超40万,节前已成立工作室,10月9日休息一天
10月8日,江西景德镇鸡排哥在个人社交账号发布一则视频,向全国各地来到家乡景德镇游玩和打卡买鸡排的游客表示感谢。鸡排哥表示近期天气炎热
2025-10-09 12:09:00
大疆部分产品直降千元!消费者炸锅,官方回应
10月8日,大疆在官网提前挂出“双十一”促销信息,多款产品价格直降数百至上千元。此次降价幅度较大。从几百元到几千元不等
2025-10-09 13:45:00
单日游客最高突破6.9万人次 忠县橘若·忠州渡接住“泼天流量”
这个国庆假期,重庆忠县江畔的橘若·忠州渡结结实实地“火”出了圈,八天揽客30余万人次,游客单日最高接待量突破6.9万人次
2025-10-09 13:57:00