• 我的订阅
  • 科技

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

类别:科技 发布时间:2024-02-16 18:20:00 来源:财经风云

2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。

目前官网上已经更新了48个视频demo,在这些demo中,Sora不仅能准确呈现细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

例如一个Prompt(大语言模型中的提示词)的描述是:在东京街头,一位时髦的女士穿梭在充满温暖霓虹灯光和动感城市标志的街道上。

在Sora生成的视频里,女士身着黑色皮衣、红色裙子在霓虹街头行走,不仅主体连贯稳定,还有多镜头,包括从大街景慢慢切入到对女士的脸部表情的特写,以及潮湿的街道地面反射霓虹灯的光影效果。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

电影预告片讲述了30岁宇航员戴着红色羊毛针织摩托车头盔的冒险经历,蓝天、盐漠,电影风格,35毫米胶片拍摄,色彩鲜艳。

AI想象中的龙年春节,红旗招展人山人海。有紧跟舞龙队伍抬头好奇观望的儿童,还有不少人掏出手机边跟边拍,海量人物角色各有各的行为。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

竖屏超近景视角下,这只蜥蜴细节拉满:

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

网友直呼gameover,工作要丢了:

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

甚至有人已经开始“悼念”一整个行业:

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

还有网友表示,电影业要彻底颠覆了。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

一位YouTube博主PaddyGalloway发表了对Sora的感想,他表示内容创作行业已经永远的改变了,并且毫不夸张。“我进入YouTube世界已经15年时间,但OpenAI刚刚的展示让我无言…动画师/3D艺术家们有麻烦了,素材网站将变得无关紧要,任何人都可以无壁垒获得难以置信的产品,内容背后的‘想法’和故事将变得更加重要。”

对于Sora当前存在的弱点,OpenAI也不避讳,指出它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系。

例如“五只灰狼幼崽在一条偏僻的碎石路上互相嬉戏、追逐”,狼的数量会变化,一些凭空出现或消失。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

该模型还可能混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

如提示词“篮球穿过篮筐然后爆炸”中,篮球没有正确被篮筐阻挡。

OpenAI发布首个文生视频模型Sora,网友:工作要丢了!

OpenAI表示,他们正在教AI理解和模拟运动中的物理世界,目标是训练模型来帮助人们解决需要现实世界交互的问题。

随后OpenAI解释了Sora的工作原理,Sora是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构,有极强的扩展性。

视频和图像是被称为“补丁”的较小数据单位集合,每个“补丁”都类似于GPT中的一个标记(Token),通过统一的数据表达方式,可以在更广泛的视觉数据上训练和扩散变化,包括不同的时间、分辨率和纵横比。

Sora是基于过去对DALL·E和GPT的研究基础构建,利用DALL·E3的重述提示词技术,为视觉模型训练数据生成高描述性的标注,因此模型能更好的遵循文本指令。

如今,Sora正面向部分成员开放,以评估关键领域的潜在危害或风险。同时,OpenAI也邀请了一批视觉艺术家、设计师和电影制作人加入,期望获得宝贵反馈,以推动模型进步,更好地助力创意工作者。OpenAI提前分享研究进展,旨在与OpenAI以外的人士合作并获取反馈,让公众了解即将到来的AI技术新篇章。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-16 20:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-16 18:44:00
谷歌VideoPoet大模型上线,生成长达10秒视频,还可自动配音 | 最前线
...编辑|邓咏仪 尚恩Google又又又发布了新模型,这次是在文生/图生视频赛道又“卷”了一把对手们。12月19日,谷歌专门发了一款搞视频生成的模型VideoPoet
2023-12-22 14:45:00
视频生成大模型sora和可灵的区别在哪里?
...者将OpenAI官方公布的5条Sora视频提示词投喂给可灵,对其文生视频的能力进行测试,同时从动态、视效、细节、场景等多维度表现进行结果比对和关联。测试和观察后发现,虽然在部
2024-06-26 14:27:00
别等Sora了!这些国产AI视频大模型,款款都超能打
...在国内众多视频大模型中,体验足以位列前三。可灵支持文生视频和图片生成视频(也可以加入文字描述)两种模式,而且可以调整创意想象力和创意相关性。可灵1.5大模型免费用户使用文生视
2024-12-11 20:13:00
赛道正在变得拥挤 腾讯混元大模型杀入文生视频 让用户 “用起来”是关键
...)昨日,腾讯混元大模型正式上线视频生成能力,这是继文生文、文生图、3D生成之后,混元大模型的最新业务进展。与此同时,腾讯开源该视频生成大模型,参数量130亿,是当前最大的视频
2024-12-04 09:56:00
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...天,腾讯混元大模型正式上线视频生成能力,这是在腾讯文生文、文生图、3D生成之后的最新技术进展。据腾讯混元多模态生成技术负责人凯撒现场介绍,此次更新中,HunYuan-Vide
2024-12-04 09:49:00
Sora横空出世,马斯克惊叹,网友:工作要丢了
...了2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频
2024-02-17 21:02:00
谷歌推出“文生视频”扩散模型
1月29日消息,谷歌研究院日前推出了一款名为Lumiere的“文生视频”扩散模型,主打采用自家最新开发的“Space-TimeU-Net”基础架构
2024-01-29 11:15:00
最强开源文生图模型一夜易主!SD原班人马打造,要发SOTA视频生成模型
最强开源文生图模型一夜易主!智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX
2024-08-05 09:39:00
更多关于科技的资讯:
3月9日,2026福布斯中国杰出商界女性100榜单发布,山西美锦能源股份有限公司董事、首席ESG官、氢能与可持续发展部总经理姚锦丽
2026-03-12 20:32:00
行舟清淤,一键搞定!西湖“黑科技”清淤船上线!
2026-03-12 22:49:00
江南时报讯 在数字化浪潮与客户需求多元化的时代,零售金融服务的核心正从单一产品交付转向深度场景融合与客群精细化运营。新沂农商银行始终坚持以客户为中心
2026-03-13 03:28:00
【宅男财经|专家面对面】近日,多地发布住房公积金制度新政,有城市支持用于住房改造、租房、重大疾病提取,有城市支持用于住房
2026-03-12 17:43:00
福州打造无人车应用新赛道 聚焦打通服务民生“最后一公里”
无人驾驶运载机器人可便捷实现“最后一公里”投送。福州新闻网3月12日讯(记者 朱丽萍/文 包华/摄)今后,您的审批文件将实现“无人接力”
2026-03-12 18:08:00
福州新闻网3月11日讯(记者 颜澜萍)近日,2026数字中国创新大赛·信创赛道全面启动报名工作。赛道紧密围绕信息技术应用创新国家战略
2026-03-12 18:09:00
连云港海州区:首批人工智能应用场景机会清单发布
为深入激活人工智能OPC创新模式活力,推动数字技术与实体经济深度融合,海州区正式发布首批人工智能OPC社区应用场景机会清单
2026-03-12 18:22:00
中国网3月12日讯据“国家工业信息安全发展研究中心”微信公众号消息,3月12日,国家工业信息安全发展研究中心发布关于工业领域OpenClaw应用的风险预警通报
2026-03-12 20:04:00
福州新闻网3月10日讯(记者 谭湘竹)3月10日,2026数字中国创新大赛全新增设的数据标注赛道,面向全国各类创新主体开启报名
2026-03-12 18:09:00
平安人寿山东分公司:智慧服务无障碍 人工服务有保障
鲁网3月12日讯随着数字金融深入民生,智能化、线上化已成为金融服务的主流趋势。在推动数字化升级的同时,公司始终坚守“金融为民”初心
2026-03-12 18:04:00
在声音经济崛起与全民素养提升的浪潮中,越来越多人渴望通过专业训练改善发音、解锁声音价值,梨花声音教育作为十方融海旗下核心品牌
2026-03-12 14:41:00
连接中国读者与世界文化 京东图书携精选书目亮相2026年伦敦书展
3月10日至12日,2026年伦敦书展于奥林匹亚展览中心举行,京东图书携手京东全球售精选优质书目亮相这一全球出版业春季盛会
2026-03-12 15:10:00
宁阳县第一人民医院脑电生物反馈治疗:为大脑做科学的“放松训练”
鲁网3月12日讯在快节奏的现代生活中,人们常常需要同时处理多项任务,承受各种压力,可能会出现注意力不集中、失眠等情况,严重者甚至引发头痛
2026-03-12 15:38:00
“找春天”为主题 CHIC2026(春季)在沪开幕
以“找春天”为主题的CHIC2026(春季)3月11日在沪启幕。作为中国服装产业的风向标与晴雨表,本届展会在117,200㎡展呈空间内
2026-03-12 15:53:00
上饶银行鄱阳支行以“赣质贷”助力科技小微企业跑出创新发展“加速度”
.wordContentCss_17732994133111{ font-family:宋体; font-size:14pt
2026-03-12 16:02:00