• 我的订阅
  • 科技

Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤

类别:科技 发布时间:2024-02-20 11:48:00 来源:南方都市报

近日,博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。这段短片利用了AI规划分镜并绘制图片,再辅以“图片生产视频”软件让图片“动起来”。视频作者冯先生在接受媒体采访时表示,这段视频如果人工制作至少需要半年,而自己在AI的帮助下用时一周就完成了。

值得一提的是,上述动画短片并非由AI直接生成,在动作画面上也有局限性,无法实现复杂的打斗场景。然而,短视频生成模型Sora的问世,让AI根据指令直接生成复杂逼真的动画成为可能。

北京时间2月16日凌晨,Sora“横空出世”。这是OpenAI推出的一款能根据文字指令即时生成短视频的模型。OpenAI曾在2022年11月30日发布名为ChatGPT的全新聊天机器人模型,开启了AI新时代。此番,OpenAI强势推出又一王炸Sora,将带来哪些改变?

谈及OpenAI开年的这一震撼级发布,多名业内专家在连线中向南都记者表达了一个共识,即目前的Sora功能让人眼前一亮,但仍未完全进化。

Sora震撼来袭,AI动画以假乱真了吗?专家:仍存硬伤

眼见不再“为实”

深度生成视频以假乱真,AI监管迎新挑战

2月16日,OpenAI宣布推出文生视频大模型“Sora”,迅速引发AI圈的关注。Sora展示的全新影像画面精细生动,远胜于此前生成式AI所生产的动画内容。这款模型不仅能理解用户的要求,还了解物体在物理世界中的存在方式。

中国人工智能产业联盟安全治理委员会专委会副主委、浙江大学教授潘恩荣认为,生成式AI从文本到图像再到视频,是一个快速发展的过程。从目前Sora官方所发布的样片来看,其强大的图像视频生成能力在某种程度上确实能达到以假乱真的效果。虽然客观实践并不会因人工智能变得虚幻,但是人的认知发生了改变。

“可以认为我们改变了一些传统的观念,比方说‘眼见为实’。”潘恩荣告诉南都记者,这也会带来社会生活的一系列问题,例如视频证据要如何举证,如何证明视频证据的有效性等。“所以从人的认知的角度来讲,这个‘真实’就不存在了。”

Sora问世前,已经出现过多起不法分子利用AI技术伪造视频诈骗的事件。今年年初,有诈骗分子用AI假造香港特首李家超和马斯克的视频向香港市民推介一项投资计划。为此,1月24日香港特区政府紧急发布新闻公告,严正澄清。去年2月,浙江省一派出所接到报案。诈骗分子截取陈先生好友“阿诚”在社交平台已发布的视频,利用“AI换脸”技术,用合成的新视频假冒好友与陈先生聊天,从而实施诈骗。

Sora如果实现大规模推广,将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍,Sora应用的技术与此前的深度伪造技术相互承接,又有所不同。深度伪造技术引起公众注意是从2018年开始的,当时的人脸“换脸”技术主要是基于GAN(生成式对抗网络)。后来,Transformer和扩散模型被成功用在文本生成图片和语音生成任务中,出现很多开源软件及成熟的工具平台。普通人简单学习之后就可以很快掌握并生成多媒体,比如让“孙燕姿”唱歌、“郭德纲”说英文等,技术的进步大大降低了普通大众进行自媒体创作的门槛。

在此前技术的基础上,Sora采用Transformer与扩散模型结合的技术路线,能够生成长达1分钟的高清视频,视频中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。“Sora相比于之前Runway、Pika等的文生视频产品,生成的视频内容在三维空间的一致性、在时间上的连贯性上都取得很大的进步。”

鉴于Sora生成的视频内容高度逼真,韩冀中指出,基于Sora的虚假信息传播可能在国际冲突、国内政治、社会、经济安全等领域带来新的挑战。目前,国内外互联网平台在内容审核上都建立了针对政治谣言、色情、暴恐类信息的检测机制。因此,互联网内容无论是不是伪造合成的,带有明确特征的不当内容都能被较为有效地甄别和拦截。但是,对于难以判断真假的信息,尤其是涉及热点舆情与名人明星的信息,在第一时间进行深度分析与研判,及时阻断其传播,依然有许多问题需要解决。随着未来AI生成内容越来越多,网络上将存在大量合成的文字、图片和视频,伪造合成的不一定是有害的,这就不仅需要在技术上改进,也需要建立更加完善的综合治理体系,才能有效实现安全防御。

科技跨越式发展?

应用场景有限,且仍有硬伤

其实,AI实现文字生成视频并不是新鲜事。韩冀中告诉南都记者,Diffusion网络的提出,催生了跨模态内容生成,使AI可以用文字生成视频,虽然生成的水平不及Sora。

而且,目前Sora的应用场景还很有限。“生成式AI从文本到影像世界,还没有到跨越式发展的程度。”腾讯机器学习平台部专家工程师姚军指出,目前Sora可以用来解决一些创意辅助的场景,但是不够可靠,所以应用的场景是受限的。

同时,目前官方也公布了一些Sora的“硬伤”。姚军解释道,因为其模型不是依靠内在的物理仿真引擎,所以所生成的视频常常显得“不可靠”,会出现不符合真实物理规律的地方,这是当下这类依赖大规模数据驱动的大规模参数模型迭代的技术思路难以根除的问题。

根据韩冀中的介绍,针对视频生成模型是否构建通用物理世界模拟器的一条有前景的道路,在学术界依然有不同观点。比如Meta的Yann Lecunn在Sora推出之前,就一直认为LLM(大型语言模型)不是世界模型的正确路径。“从Sora发布的一些失败视频中,也看到目前Sora对物体交互场景的理解还有缺陷。”

近两年可实现AGI?

“过于乐观,但Sora大规模推广在望”

针对此次Sora所带来的讨论,360创始人周鸿祎在社交网络上也分享了自己的看法。他认为,Sora的诞生意味着AGI(通用人工智能)实现可能从10年缩短至一两年。

谈到Sora最大的优势,周鸿祎表示,以往文字视频软件都是在2D平面上对图形元素进行操作,可以把视频看成多个真实图片的组合,并没有真正掌握这个世界的知识。但Sora产生的视频里,它能像人一样理解坦克是有巨大冲击力的,坦克能撞毁汽车,而不会出现汽车撞毁坦克这样的情况,“一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube和TikTok的视频都看一遍,对世界的理解将远远超过文字学习。一幅图胜过千言万语,而视频传递的信息量又远远超过一张图,这就离AGI真的不远了,不是10年20年的问题,可能一两年很快就可以实现。”

然而,在业内专家看来,认为AGI能在一两年内实现的观点过于乐观。姚军表示,“从原理上不难得出,这类模型不具备世界模型,没有真正的一套知识框架内核,只是依赖数据中体现的‘大数原理’,与现实世界有一定的重合,但远达不到‘世界模型’的门槛。”

潘恩荣也认为,AGI在一两年内实现不能作为一种真实的预测。“因为我们讲的通用人工智能往往指的是‘人’作为主体所作用的能力,然而现在人工智能能实现的事情,更像是‘物’的能力。”

对于公众何时能够大规模使用此类产品,姚军告诉南都记者,“预计很快。”姚军表示,在未见到严肃论文的情况下,仅凭感觉目前Sora是在吸取了很多LLM和文生图的迭代经验,部分解决了训练数据的约束,据说是用到了游戏引擎生成的视频数据,同时,由于传闻该模型的规模并不大,所以其成果预计可以很快进行应用落地。

但不论如何,有一件事毋庸置疑,模型后续效果的优化速度会越来越快,就像当时文生图技术出现后一样,一个季度一次升级,一年一个大变样。

采写:实习生 陈奕帆 南都记者 吕虹

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-20 14:45:12

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

“Sora目前仍不够可靠,应用场景受限”
...人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山,还有山间云卷云舒、山石崩裂等动画画面,令众多网友赞叹不已。这段短
2024-03-02 10:00:00
Sora冲击波 抢人“饭碗”促生新职业?
...成员(以对抗性的方式测试和提高OpenAI模型安全性的外部专家团队)可以使用Sora来评估关键区域的危害或风险,OpenAI还向一些视觉艺术家
2024-03-02 09:59:00
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
7月26日,智谱AI CEO张鹏在智谱Open Day上宣布,AI生成视频模型清影(Ying)正式上线智谱清言。南都记者关注到
2024-07-27 14:18:00
视频生成群雄逐鹿,哪些重要问题待解?
...AI短剧拐点背后的技术突破》。随着短视频、影视和游戏动画的快速发展,传统的视频制作方式因耗时耗力而逐渐显现局限性。视频生成大模型算法为高效生成高质量视频提供了新选择,但现有算
2024-11-26 09:38:00
文生视频让自动驾驶看到新方向
...颖聪教授认为,文生视频技术不仅能够直接应用于视频和动画制作、广告、游戏等与视频生成紧密相关的领域,还能为人工智能相关的许多领域带来革新性的思考。“尽管Sora在理解物理规律方
2024-03-14 05:26:00
OpenAI空降视频生成模型:一口气生成60s,风格画质尺寸灵活定制 | 最前线
...素的视频:提示词:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。
2024-02-18 06:20:00
...是不能“吉卜力化”的。 吉卜力风格,是指日本吉卜力动画工作室(由宫崎骏等人创办)的艺术风格,具有手绘动画、色彩柔和等特点。“吉卜力化”在社交平台刷屏背后,OpenAI的GP
2025-04-26 08:37:00
人形机器人组团“十八金刚”各类AI助手工具百花齐放
...学院自动化研究所研究员、联合国人工智能高层顾问机构专家曾毅在分享中提到一组数据显示,2023年人工智能所带来的风险是2022年的10倍以上,这意味着生成式的人工智能发展把这项
2024-07-13 09:49:00
视频大模型 快手美图殊途同归
...人吴欣鸿谈到MOKI时说,“MOKI聚焦于AI短片创作,专注于动画短片、网文短剧、故事绘本和MV等视频场景。” 具体的工作流程是:在脚本、视觉风格、角色等前期设定完成后,A
2024-06-13 23:55:00
更多关于科技的资讯:
画里有话|别让专利造假侵蚀创新生态
图/沈海涛 文/王 琦如今,一条成熟的专利造假产业链正在暗中滋生蔓延:部分专利代理机构以几百元起的低价,提供从无到有的专利全程编造服务
2026-02-10 08:07:00
走市场 看消费|直播与即时零售发力,电商销售火热
借力互联网 线上赶年集直播与即时零售发力,电商销售火热2月3日,在大名县“一品一播”产业园直播间,主播齐美冉正在直播带货
2026-02-10 08:08:00
奋进的河北·数读新变化|政策加力,以旧换新激发市场潜能
政策加力,以旧换新激发市场潜能——2025年全省社会消费品零售总额增速缘何位居全国第二(一)制图/褚林一份亮眼的消费“成绩单”
2026-02-10 08:09:00
人形机器人将再次登上春晚、四足机器人穿梭写字楼送咖啡、养老机器人上门为老人送餐送药……具身智能产业加速奔跑,近日,杭州具身智能应用中试基地产业委员会筹备会举行
2026-02-10 06:56:00
省工信厅近期启动了山西省“工信部人工智能赋能中小企业典型应用场景”入选案例展播活动。其中包括我市两个案例。中小企业人工智能典型应用场景
2026-02-10 07:22:00
启迪科学思维 探索无限可能——市科技馆“好奇π”节前寒假公益科普课圆满收官
胶东在线2月6日讯(通讯员 熊一丹)2月2日至6日,市科技馆在青少年科学工作室连续举办“好奇π”寒假公益科普课活动,课程聚焦人工智能
2026-02-10 05:00:00
2025年以来,浙江深入实施“人工智能+”行动,抢抓人工智能发展的历史性机遇,开展人工智能赋能制造业试点,加快人工智能深度赋能千行百业
2026-02-09 17:14:00
“小皖”是如何练成的?
大皖新闻讯 安徽省第十四届人民代表大会第四次会议于2月9日上午在合肥正式闭幕。省两会期间,大皖新闻人形机器人记者“小皖”成为采访现场一道独特的风景线
2026-02-09 18:44:00
《电商消费维权指数2025年度暨第四季度报告》发布 结束连续3年增长态势 回落至正常波动区间
中国消费者报报道(记者桑雪骐)2025年,我国经济总量实现新跨越。消费特别是新兴消费,是我国经济增长的重要助推器。同时
2026-02-09 14:23:00
再度蝉联茶类目第一!八马茶业与京东用十四年“泡”出一壶共赢好茶
当八马京东旗舰店在京东超级品牌周期间再次以遥遥领先的销量蝉联茶类目第一,成交用户同比增长86%,这条从古老茶园到现代都市餐桌的数字化茶路
2026-02-09 14:48:00
全家等便利店全部接入,千问免单卡能买日用百货
春节临近,2月9日千问APP提示,“免单卡”可以买年货,不仅能买盒马、天猫超市,还能购买各大连锁商超和便利店的酒水零食
2026-02-09 15:00:00
以“智”提效 向“新”而行 | 威海银行智慧服务迈上新台阶
“以前办理大额存款得去柜台排队,现在智能柜台几分钟就能办好,还能开具存单,太方便了!”近日,客户刘先生在威海银行青岛路支行体验智能服务后评价道
2026-02-09 15:27:00
制作包装瓶、注油、压盖、加提手、装箱……在益海嘉里金龙鱼集团上海工厂的食用油包装车间,一整套流程在自动化生产线上顺畅运转
2026-02-09 16:33:00
华为应用市场7.0.1.300版本更新,支持远程守护功能
近日,华为应用市场迎来7.0.1.300版本更新,新增远程守护功能,用户可通过该功能与孩子或长辈建立安全守护关系,实现远程应用安装管理
2026-02-09 16:37:00
新闻多一点|国家信创园:在这里看见未来
2月9日上午,习近平总书记来到位于北京亦庄的国家信创园,了解信息技术应用创新和北京加快建设国际科技创新中心情况。为统筹创新资源
2026-02-09 16:44:00