我的订阅
科技

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI空降视频生成模型：一口气生成60s，风格画质尺寸灵活定制 | 最前线

类别：科技发布时间：2024-02-18 06:20:00 来源：36氪

文 | 周鑫雨

编辑 | 苏建勋

2023年4月，成立于纽约的Runway AI发布了一段用AI生成的视频：模糊卡顿、物体扭曲，且仅4秒；

四个月后，Runway将文生视频的视频效果拉到了4K的超逼着高度，实现了镜头的连贯稳定。而视频的最大长度也从4秒，提升到了18秒——这也是2023年文生视频的“时长天花板”。

然而，就在北京时间2024年2月16日凌晨，“天花板”又被打破——OpenAI又出王炸，发布了可以生成60秒视频的AI模型Sora。

OpenAI空降视频生成模型：一口气生成60s，风格画质尺寸灵活定制 | 最前线

OpenAI官宣Sora。

同样在2月16日发布的谷歌最新多模态模型Gemini Pro 1.5，则被Sora迅速夺走了关注度。

网友为Gemini和Sora制作的梗图。

根据OpenAI官方发布的推文和技术报告，Sora能力的革命性可以被提炼为：最长生成60s视频、镜头的前后一致性、超逼真。

从官方发布的视频demo而言，Sora只需要输入包含“构成元素、环境、行为及发生顺序、视频风格”等关键因素的Prompt（提示词），就能生成不同风格的高清、连贯，且具有丰富运镜和转场的60s级视频。

比如生成包含人物和城市元素的视频：

提示词：一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。

Sora生成视频（原视频为60s，文中截取20s，画质受gif大小限制有所压缩）。图源：OpenAI

Sora也能生成动物和自然风光：

提示词：几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走近，它们长长的毛茸茸的皮毛在风中轻轻飘动，远处覆盖着积雪的树木和雄伟的雪山，午后的阳光下有缕缕云彩，太阳高高地挂在空中距离产生温暖的光芒，低相机视角令人惊叹地捕捉到大型毛茸茸的哺乳动物，具有美丽的摄影和景深。

Sora生成视频（画质受gif大小限制有所压缩）。图源：OpenAI

Sora生成的视频已经能够达到逼真的效果。不过，用3D和动漫风格生成虚拟场景对Sora而言也不在话下：

提示词：动画场景的特写是一个毛茸茸的小怪物跪在融化的红蜡烛旁边。艺术风格是 3D 和现实的，重点是灯光和纹理。这幅画的气氛是一种惊奇和好奇，怪物睁大眼睛、张开嘴巴凝视着火焰。它的姿势和表情传达出一种天真和俏皮的感觉，就好像它第一次探索周围的世界一样。暖色调和戏剧性灯光的使用进一步增强了图像的舒适氛围。

Sora生成视频（画质受gif大小限制有所压缩）。图源：OpenAI

突破时长和逼真的瓶颈，Sora摸着DALL-E过河

在半年前，在保证生成画质的前提下时长仅仅是突破10秒，对于多数视频模型而言都是难以企及的高度。

这是由于循环网络、生成对抗网络、Diffusion模型等主流视频建模范式，通常只能学习某一小类的视觉数据、较短的视频或者固定大小的视频。

这意味着，此前主流范式下的视频生成模型对训练数据有较高的要求，需要将训练数据处理为具有标准大小、裁剪尺寸的视频。

Sora的技术报告显示，为了构建Sora，OpenAI创新性地采用了文生图模型DALL-E 3的相关技术：将Diffusion模型（可以将随机像素大致转换为图像）与Transformer神经网络（支持处理长数据序列）相结合。

这意味着，Sora可以像处理文字和图像数据一样，对视觉数据进行分块式地理解分析，不用进行标准化的预先处理。

比如对应大语言模型中将文本分割为最小的处理单位Token，Sora也通过压缩视频到较低维度，将视觉数据分割为可分块处理的补丁（patch）。并且随着训练计算量的规模式（Scaling）提升，视频生成质量会显著提高。

基于基础计算量生成的样本效果。图源：OpenAI

基于4倍计算量生成的样本效果。图源：OpenAI

基于16倍计算量生成的样本效果。图源：OpenAI

基于原始数据而非标准化处理数据的训练，不仅可以让Sora初步拥有理解真实或虚拟世界的能力，还能灵活生成时长不同、分辨率和尺寸各异的视频（目前可生成的尺寸范围是：宽屏1920x1080p~竖屏1080x1920p），以适应不同场景和设备的使用需求。

Sora生成不同尺寸下的同主题视频。图源：OpenAI

不过，仍有不少专家以审慎的态度看待这次技术突破。伊利诺伊大学厄巴纳－尚佩恩分校信息科学教授Ted Underwood在华盛顿邮报的采访中表示，OpenAI可能会挑选可以展示模型最佳表现的一些视频。

再比如，普林斯顿大学计算机科学教授 Arvind Narayanan在X推文中指出，Sora生成的时尚女子在东京街头行走的视频中，女子的左右腿交换了位置，背景中的人物在被前进物体短暂遮挡后消失了。

Arvind Narayanan的推文，可仔细观察原视频14-16秒处的双腿交换。

OpenAI官方也放出了一些“Sora翻车视频”，展示了Sora在理解复杂场景的物理原理、因果关系、空间细节、时间推移上的弱点。比如，它搞反了人在跑步机上跑步的方向。

Sora生成的视频截图。提示词：打印一个人跑步的场景，35 毫米电影胶片。

Sora杀死Runway们，伦理安全引发大众担忧

2022年，TikTok观看量Top 10的视频平均时长为44.2秒，最长的一个视频长达2分16秒；

广告分析公司Integral Ad Science的统计数据显示，移动网络展示广告和移动应用的广告平均时长分别为15.6秒和20.2秒。

这意味着，一旦文生视频模型突破了60s的时长瓶颈、画质达到商用级别，对于用户的生产和娱乐方式，都会产生巨大的影响。《马戏之王》导演Michael Gracey告诉华盛顿邮报：“电影制作者不再需要一个由 100 或 200 名艺术家组成的团队，在三年内制作他们的动画长片。这让我很兴奋。”

然而，他依然对AI工具可能会造成的版权争议、失业问题而感到担忧：“它（AI）剥夺了其他人的创造力、工作、想法和执行力，却没有给予他们应有的荣誉和经济报酬时，那就不好了。”

由于Sora生成的视频质量远高于多数视频生成模型，尤其现实风格让人真假难辨，不少专家也表达了对视频深度伪造（Deepfake）的担忧。政治竞选虚假信息识别组织True Media创始人、华盛顿大学教授Oren Etzioni在纽约时报的采访中表示：“我非常害怕这种事情会影响一场势均力敌的选举。”

目前，OpenAI为Sora生成的视频自动添加了水印标记，以表明由AI生成。OpenAI创始人兼CEO Sam Altman在X上表示，目前Sora正在展开红队测试（Red-Teaming，一种安全评估方法），并只对少数人开放测试。

Sam Altman的推文。

不过，即便尚未正式对公众开放，Sora的能力已经引起了不少视频模型创业者的恐慌。

“当一个质量更好、时长更长、应用场景更广泛的视频模型摆在面前，没有人还想用‘Runway们’。”一名AI创业者告诉36氪，“对模型层创业者来说，当务之急还是赶紧找场景、做应用。”

以上内容为资讯信息快照，由td.fyun.cc爬虫进行采集并收录，本站未对信息做任何修改，信息内容不代表本站立场。

快照生成时间：2024-02-18 08:45:01

本站信息快照查询为非营利公共服务，如有侵权请联系我们进行删除。

信息原文地址：

更多关于生成,一口,空降,画质,模型,一口气的资讯：

努比亚一口气发布两款AI手机

今天下午，努比亚一口气发布两款AI手机：努比亚Z60Ultra领先版、努比亚Z60SPro。它们均依托行业领先的自研星云AI大模型

2024-07-24 03:35:00

腾讯混元一口气开源5个3D生成模型：最快30秒生成！

快科技3月19日消息，腾讯最新公告，一口气开源5个3D生成模型，通过腾讯混元3D官网即可体验。据介绍，这5个开源模型均基于Hunyuan3D-2

2025-03-19 00:26:00

大厂加码落地大模型，京东云一口气发了10个AI应用

...nchmark。" 京东云新发布的AI应用，图片由公司提供为什么一口气发这么多AI产品，京东云言犀相关人士的回答是："电商需要的是一整套的系统的AI应用，而不是某一款提供单

2024-12-07 09:55:00

字节版Sora终于来了！一口气两款视频模型，带来的震撼不只一

...字节跳动旗下的火山引擎在深圳办了一场 AI 创新巡展，一口气发布了两款视频生成大模型，正式宣告进军 AI 视频生成

2024-09-26 13:45:00

云计算一哥终于搞多模态了：一口气6个大模型，还有个3nm芯片

...布自家新款AI多模态系列大模型，名曰Amazon Nova。而且是一口气涵盖文本对话、图片生成、视频生成，甚至直接吐露一个小目标

2024-12-05 09:45:00

《玉骨遥》空降，一口气放出4集，登顶热搜

由肖战和任敏合作主演的《玉骨遥》终于正式和大家见面了，这部剧在两年前就已经杀青两年的时间里，也曾多次的被网友提到。很多粉丝都期待能够早日看到这部作品，但粉丝们每一次贡献热度之后，

2023-07-04 15:48:00

周鸿祎一口气发布200多个数字人 “马斯克”“孙悟空”“诸葛

昨日（6月13日）， 360正式发布“360智脑”大模型应用，360智脑从1.0迭代至4.0版本，包括360安全卫士、360安全浏览器

2023-06-14 13:00:00

曝《无忧渡》本周空降，刘诗诗新剧延后，宋祖儿或一口气播两部剧

...忧渡》，那腾讯内部也立马就抬《折腰》，宋祖儿有可能一口气播两部剧。关于宋祖儿的税务问题，此前工作室声明经税务机关核查，宋祖儿无偷逃税款的行为，也未因税务事宜被处罚，而且这

2025-04-11 08:22:00

新剧空降开播！一口气追六集不过瘾，观众连刷好评，又抓到好剧了

如今，市场上能够看得下去的电视剧可能要数周迅的不完美受害人还有张一山和关晓彤的曾少年了。这两部电视剧还是蛮对我的口味的，但是因为追剧的节奏太快，所以已经追平了，在成毅新剧莲花楼还

2023-07-24 22:11:00

更多关于科技的资讯：

代表委员请留步｜侯景滨代表：人工智能+，加出河北新质生产力

视频摄制：冯阳霍艳恩赵新宇王思宁

2026-03-07 10:02:00

中国青年医师IP孵化计划在杭州启动

2026年3月5日，以“AI链全球生态共生”为主题的中国青年医师IP孵化计划在杭州启动。本次活动来自全国多所医院的专家

2026-03-07 10:40:00

租金两块钱一分钟 “共享机器人”即将入驻杭州商场、电影院

星枢智能的“机器人家族” 记者杨亦淇摄一台售价20多万元的春晚同款人形机器人，现在花5000元就能租一天；如果是基础款

2026-03-07 08:05:00

人工智能技术对金融机构运营效率的影响

摘要：随着信息技术的快速发展，人工智能技术逐渐渗透金融机构的各类业务与管理环节，对传统金融运作模式产生了深刻影响。金融机构在激烈竞争和成本约束的背景下

2026-03-07 05:46:00

上线智能应用防控消防隐患

近日，省应急管理厅举行“AI+工业企业火情预警（火眼哨兵）”“AI+烟花爆竹监管（烟花卫士）”应用上线发布仪式。浙江拥有30余万家工业企业

2026-03-07 07:34:00

微视频丨13年后复产的老胶卷成年轻人新宠——传统产业升级也有

视频摄制：张晶、赵新宇、朱泊宇

2026-03-07 07:47:00

成为OPC很简单，但成功OPC很困难代表委员热议“一人公司

今年的全国两会上，“一人公司”（One Person Company，简称OPC）成为代表委员们热议的话题。全国人大代表

2026-03-07 07:04:00

京东曹鹏两会建言：激活AI产业效能，夯实新质生产力发展基石

2026年全国两会正式开幕，全国政协委员、京东集团技术委员会主席、京东云总裁曹鹏围绕人工智能产业发展建言献策。他建议，推动我国AI产业实现从规模扩张到效能提升

2026-03-06 22:56:00

【南京机器人产业观察】天创机器人：何以领跑特种智能运维机器人

编者按：从生力军天创机器人开始，《大众证券报》明镜财经工作室记者将陆续探访在各种应用场景解决着实际问题的南京机器人企业

2026-03-06 22:56:00

从平台赋能到标杆涌现：青岛崂山区打造OPC创业首选地

鲁网3月6日讯2026年，是“一人公司”（OPC）从概念走向规模化实践的关键之年。当这一新型创业范式成为科创发展新风口

2026-03-06 20:12:00

春节线下实体消费增速首超线上，王微：更注重体验与情绪消费｜宅

【宅男财经｜专家面对面】据央视新闻报道，十四届全国人大四次会议今天(6日)举行经济主题记者会。商务部部长王文涛在会上表示

2026-03-06 21:54:00

从手工“制茶”到数据“智茶”：竹叶青展现AI时代品质新解法

在中国古老的传统产业版图中，茶产业无疑是最具代表性，却又最难被现代化改造的堡垒之一。长期以来，非标化、依赖人工经验、产业链条冗长等痛点

2026-03-06 17:21:00

全球AI迈向“办事时代”，千问持续推进AI生活服务落地

3月6日，千问宣布持续投入“AI办事”，用户可以让AI一句话下单各类生活服务，享受AI办事带来的便捷和立减实惠。进入2026年

2026-03-06 18:54:00

三联家电洪楼店店庆盛典3.07火热开启！

鲁网3月6日讯春暖花开，焕新正当时！一年一度，三联家电洪楼店将于3月7日至3月15日隆重举办店庆盛典，为广大消费者带来一场诚意十足

2026-03-06 17:08:00

2025ITEC颁奖典礼在京举行半导体AI创新成果引关注

2月4日，第十三届朝阳国际人才创业大会（ITEC2025）创新峰会在北京举办，大会全球创业赛获奖名单同期正式揭晓——“人工智能在半导体制造的应用与研究”项目凭借核心技术突破与产业化落地实效

2026-03-06 14:10:00

头条订阅服务

OpenAI空降视频生成模型：一口气生成60s，风格画质尺寸灵活定制 | 最前线