• 我的订阅
  • 科技

从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析

类别:科技 发布时间:2022-12-21 18:46:00 来源:36氪

作者 | 邓咏仪

编辑 | 苏建勋

整个科技行业经历了让人疲惫的2022年。但下半年,AI来了个华丽的返场——

登台的新宠儿名为“AIGC”,又称“生成式AI”(Generative AI)。这一领域正以令人侧目的速度发展,将创新和技术再度拉回到世界舞台的焦点。

今年4月,一家名为Open AI的公司公布旗下的DALL-E 2模型,其用文字生成图像的质量之高,让人震惊——以前,“AI画画”还只是一小群人的游戏,AI画出来的画,像出自小学生之手一样朴实稚拙。

但很快,大家发现AIGC进步神速。仅仅过了4个月,一名游戏设计师凭借AI模型Midjourney画出来的一幅画,夺取知名艺术大奖,这惹来争议一片。

从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析

而刚过去的10月,AIGC的另一家代表公司Stability.AI,仅仅成立2年,就宣布完成1.01亿美金的种子轮融资,估值达10亿美金,步入独角兽行列。

AI领域沉寂太久了。上一次AI吸引巨大的公众关注度,还要追溯到2016年——AlphaGo在围棋比赛中最终击败韩国国手李世石。过去几年里,AI有点像科技圈里的过气网红,技术上少有让大众惊喜的进展。在国内,AI公司的更多新闻是上市受挫、盈利遥遥无期。

如今,AIGC接棒AlphaGo,带着全新的故事归来。

最新的进展是,AIGC已有强劲的商业化苗头。一家名为Jasper的公司,用AI帮助企业和个人客户写社交媒体、博客等内容。Jasper最近宣布,今年收入预计近亿美元,这距离这家公司成立仅过去18个月。

浪潮已然来临。AIGC已处在爆发前夜,一个技术和商业化交汇的路口。巨大的关注度背后,是整个产业链的蓄势待发,摩拳擦掌。

AI重归舞台中心,大厂小厂齐下场

以AI生成文字、图像、音频等内容,是已经存在已久的深度学习方向。在2017年,一副由AI学习大量画作,最后“模仿”生成的作品,就已经在佳士得进行拍卖出超过40万美元的价格。

但从今年开始,各种各样的AI绘画应用,如同雨后春笋一般冒出。无论是大厂小厂,都像约好了一样发布AI绘画产品:2月,Disco Diffusion推出AI图像生成平台;7月,微软旗下的Open AI推出新模型WALL-E2,并进行公测;8月,Stability AI推出Stable Diffusion,并开放注册……

与2017年时相比,现在的AI画画到了“Text-to-Image”(文字生成图像)的新阶段。即用户描述画面中的内容、风格、材质、位置等,提供一个词群(如深邃的太空、达利画风、远景),机器就能进行解析,最后输出一张画作。

在以前,人们普遍意义上感受到AI的技术改革,很大程度都是在于一些决策性行为,如识别人脸(是否符合本人)、下棋(如何得出最优解)等等。

而“输入文字-AI画画”的最大不同,在于底层的AI模型的学习模式是发散性的——简而言之,是通过对文字、图片、数据等信息的学习,AI要自己开始“模仿”和“创造”新的东西。这大大降低了人们的创作门槛。

AI绘画能发展如此之快,原因首先在于,前几年全球科技行业斥巨资和大量人力,大练“AI大模型”,为之打下基础。

AI大模型,顾名思义,即是拥有巨大样本量的模型。2017年,Transformer结构的提出,让得深度学习模型参数突破了1亿。随着深度学习技术发展,模型中的数据量,更是逐步到了十亿级,再到百亿级。

以前用于训练AI画画的著名对抗生成网络模型“GAN”,就是一个百亿级的大模型。但以前,GAN学习画画的模式,只能做到无限接近原作的模仿,而不是创新。

从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析

真正让AI绘画取得突破的,是几家AI公司的接力,包括Open AI和Stability.AI在内的公司,将深度学习模型CAN、Diffusion等,和GAN模型进行了创新性的结合——相当于让AI换了一种学习画画的方式。这才让AI画画真正摆脱了模仿,走向“创造”之路。

而此前的AI绘画要耗费大量算力,动辄半天一天的生成时间。Stability.AI又在新模型上改进机器运算的方式,大大压缩了所需内存和空间——从一天出图,到以秒出图,对硬件要求也降到极低,C端用户才能无障碍地进行创作。

AI生成内容的星星之火开始燎原,现在新战场已经从图像走到了视频领域。9月,Meta、 Google都公布了自家的AI生成视频技术进展。比如Meta的Make-A-Video技术,就能够让平面上的物体短暂地“动起来”。

从AI画画到“用声音做视频”,全球掘金AIGC | 焦点分析

美丽新世界里,谁能淘到第一桶金?

9月,红杉资本发表了一篇名为《生成式AI:一个充满创造力的新世界》(Generative AI: A Creative New World)的文章。红杉在文中表示,生成式AI,让机器开始大规模涉足知识类和创造性工作,这涉及数十亿人的工作,未来预计能够产生数万美元的经济价值。

AIGC其商业前景看起来很诱人,这可遇不可求。比起VR/AR、新能源车等领域,尚在市场教育早期,要投入大量的教育成本。而AIGC只需算力稍微强劲一点的电脑,未来甚至可以跑在云上,其内容生成的边际成本无限接近于0。

巨大的商业空间已经显现——在写作、设计、影视、广告等多个领域,AI相当于可以作为人类的“副手”,可以快速提供一些最为基本的创意指导。

但AIGC无限拓展和输出的特性,也伴随着人们的担忧:商业壁垒到底在哪里?

市面上已有不少关于“调包侠”的讨论。如今市面上所有的AI绘画产品,基本都是基于几个开源模型开发。内核不变,只简单搭壳的情况下,调用的都是类似的模型。若都给AI喂类似的数据,这些产品输出的结果,是否也会逐渐趋同?

大厂们在算力、数据训练上投入多年,底层基础设施注定是大公司的游戏。不过,由于大厂间内卷得厉害,成本在急速下降。据一家美国风投机构NfX统计,在过去2个月中,AI生成图像的成本下降了100倍。

显然,底层技术和模型无法成为壁垒。应用层的竞争已经开始——想要让AIGC打开商业新局面,真正达到规模化,市场需要一个杀手级的应用。

NfX创始人James Currier在博客里举例——Facebook成立时,市面上有50个和它一样,有着相同功能的产品。但Facebook最巧妙的选择在于,从哈佛大学的学生群体开始推广,最终吸引到各个大学的学生竞相跟随。

淘到第一桶金的AIGC公司也很类似,他们大多抓住了不错的垂直场景。比如Copy.AI,从公司成立开始就看准广告营销场景,让AI帮助客户优化营销场景中的文案等内容。Copy.AI商业化进展迅速——两年内的ARR(年度经常性收入)就已经达到1000万美元。

远在大洋彼岸的AIGC热潮,同样点燃了国内市场的热情。

7月,百度就在百度世界大会上,用了“1秒”复原了《富春山居图》残卷——背后依托的正是千亿级的AI大模型“文心”。

除了百度,在创业公司方面,也已经有彩云小梦、Tiamat、蜜度、6pen、MuseArt等公司,其中不乏已经投入数年的公司,他们覆盖了文字、图像等方向。今年,他们也成了VC圈的新任香饽饽。

但国内的技术发展和商业化处在更早期。国内市场上已经有层出不穷的AI绘画小生意,比如在抖音、闲鱼等平台开展代画服务,提供词组调试攻略等等,很多人声称“AI画画,月入过万”。但这些生意都相对边缘。

短期内,AIGC还是要依靠企业端,才能有足够资源支撑起底层技术的快速迭代。尤其对国内而言,中文数据的NLP(语义识别)比英文更为复杂,要做中文版的AI生成技术,不是简单汉化就能够解决问题。像百度和清华的AI模型均为自研,底层模型的训练成本还处在高位。

在一位AIGC观察者的博客中,一家创业公司MuseArt的创始人曾提及:每次训练AI模型的成本都在2万元左右,通过收取C端用户费用,根本无法覆盖这么巨大的支出。而近期刚刚完成融资的国内AIGC平台TIAMAT,也宣布已经和多个龙头游戏企业、广告平台合作。

AIGC在载体上没有太多桎梏,在寻求商业化的路上,未来它更多要解决的是法律、监管以及伦理问题。前不久,日本绘画AI平台“mimic”上线,很快遭到众多日本画手抵制,声明“禁止AI学习自己的画作”。现在,包括Stability在内的平台,也正在卷入版权等不少争议。

AI绘画让人类一窥技术能够创造的未来图景,这足够让人激动,只是它还需更多时间完善自身。对感兴趣的人来说,对技术进步抱以更大的宽容,保持关注,或许才能更好地让AI为己所用。

正如Stability.AI的slogan所言——“AI by the people, for the people”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2022-12-21 19:59:37

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

更多关于声音,焦点,分析,全球,视频的资讯:
英外交大臣:再不听听南方国家的声音,西方就有麻烦了
...来越不耐烦。“除非西方学会更好地倾听全球南方国家的声音,否则将有麻烦。”尽管克莱弗利辩称,英国也对其他全球事务做出了贡献,但在不少全球南方国家官员看来,西方国家外长只是在不停
2023-09-21 17:53:00
快手大模型首次集体亮相 获《焦点访谈》报道关注
...会暨人工智能全球治理高级别会议在上海闭幕。据央视《焦点访谈》报道,今年的大会展览持续扩容升级,展览规模、参展企业数、亮点展品数、首发新品数均创历史新高。大会聚焦大模型、算力、
2024-07-08 10:10:00
是时候正视储能爆炸事故了! | 焦点分析
...不断,也招致国内外不少对于锂电池储能技术路线诟病的声音。 追根溯源,电化学储能作为一种基于化学反应原理的技术,很难做到100%绝对安全,这是源于锂电池储能本质上存在的安全性
2023-11-04 09:44:00
52岁康辉在美国工作日常!与全球媒体人争辉
...许的。康辉的报道不仅影响了美国,也影响了世界。他的声音和观点,代表了中国媒体人的专业素养和人格魅力。他的报道和评论,以其独特的视角和深入的分析,让世界看到了中国媒体人的实力和
2023-11-16 15:06:00
背水一战狙击GPT-4,谷歌最强大模型Gemini终发布,听说读写全能选手 | 焦点分析
...自然的和世界交互的方式:用眼睛看到东西,用耳朵听到声音,再把这个东西的语义用声音/文字输出,再做出决策。Gemini的发布,只是掀起了多模态领域的一角。多模态领域还在技术探索
2023-12-07 08:18:00
《碟中谍7》的超级AI令人胆寒,现实可能更加凶险|焦点分析
...AI,它无处不在,可以瞬间清除实时视频,冒充任何人的声音,破解人的身份安全码(甚至是指纹码),轻松入侵全世界的赛博空间。只有一把金属钥匙可以关闭智体。为了争夺钥匙,阿汤哥饰演
2023-07-24 15:48:00
“年度反转”室温超导,8月的一场愚人节 | 焦点分析
文 | 雪小顽编辑 | 苏建勋整理、制图 | 张玉琼、周愚最近半个月,室温超导是当之无愧的硬科技圈“顶流”。事件进展可谓“日日新”。自7月22日韩国宣布合成LK-99超导体,忙于
2023-08-10 10:18:00
...网络意识形态斗争,努力把互联网这个最大变量变成正面声音的最大增量,这是摆在我们面前的一项重大课题。“秉纲而目自张,执本而末自从”。习近平总书记强调,源清则流清,要坚持以正面声
2026-01-06 21:47:00
「怀胎」七年,苹果MR眼镜要来了 | 焦点分析
作者 | 袁斯来编辑 | 苏建勋这是苹果历史上很少出现的情节。根据金融时报报道,苹果MR设备或将在6月全球开发者大会WWDC上亮相。不同寻常的是,苹果的设计团队和运营团队对发布时
2023-03-16 12:48:00
更多关于科技的资讯:
大河网讯(记者 王怡潇 马绍坤)“俺这库里的棉花卖得快,早上入库下午就出库!”在河南舞钢市,中昌物流靠着给棉花办“身份证”
2026-03-27 11:44:00
“宠宝通”正式上线:打开宠物寄养新商机,为低成本创业进入宠物赛道提供新路径
近日,由杭州互联网公司新秀万思奇科技有限公司打造的宠物寄养管理系统平台——“宠宝通”微信小程序正式上线。作为一款聚焦宠物寄养管理与宠物生活服务的数字化平台
2026-03-27 13:39:00
罗庄:AI赋能铝合金制造,打造工业智改标杆场景
鲁网3月27日讯近日,山东省临沂市罗庄区临沂利信铝业有限公司铝合金智能配料与全流程协同制造场景落地见效,以人工智能深度赋能铝基新材料生产
2026-03-27 11:06:00
山海有约,樱你而美——青岛市崂山区文创大赛延期至4月12日,北宅樱桃赛道全新开启!
鲁网3月27日讯自“山情海韵 创见未来”青岛市崂山区第三届文创设计大赛启动以来,来自全国各地的文创设计爱好者、高校师生
2026-03-27 11:06:00
厦门举办四场创新场景供需对接
厦门大学附属第一医院展示的全息混合现实医学导航定位系统。(记者 陈立新 摄)厦门网讯(厦门日报记者 王元晖)超过100家带着新技术
2026-03-27 08:20:00
春日为序,西湖区与“文创”相约。昨日,2026年西湖区文创大会在杭州茶叶博览会会议会展中心举行。大会现场发布了西湖区文化“新三样”扶持政策与“三个十”年度案例
2026-03-27 08:29:00
持续推进场景创新 今年屈臣氏计划改造1500家门店
为庆祝屈臣氏集团创立185周年,一家「屈臣氏大药房」以复古主题快闪店的形式落地广州沙面,迅速成为年轻人的打卡胜地,见证着新潮的互动体验与年轻的消费面孔
2026-03-27 08:37:00
交通银行信用卡 春日礼遇已就位
鲁网3月25日讯春日礼遇已就位,交行信用卡宠粉不停,消费满额刮惊喜刷卡金。最红周五享5折优惠,环球漫游笔笔有返现,焕新满减+购票立减,多重好礼陪你过春天。(鲁网记者)责任编辑:范
2026-03-27 09:16:00
优衣库与洛杉矶道奇队达成重要合作,“优衣库·道奇体育场”正式亮相
2026年3月26日,美国洛杉矶—— 全球服饰零售品牌优衣库宣布与洛杉矶道奇队达成一项重要合作,双方将携手为道奇队球迷
2026-03-27 09:55:00
合肥国显8.6代AMOLED产线完成厂房清扫,即将量产
3月26日,合肥国显科技有限公司(以下简称“合肥国显”)第8.6代AMOLED生产线项目在主厂房举行洁净室清扫仪式,标志着全球首条搭载无FMM技术(ViP)的高世代AMOLED生产线已顺利完成厂房建设交付
2026-03-27 08:37:00
入驻英国第一渠道 海尔冰箱上市首日斩获用户青睐
当地时间3月18日,海尔全球旗舰Horizon系列冰箱于英国格林尼治皇家天文台完成全球首发,同步在英国第一家电零售渠道Currys开售
2026-03-27 09:53:00
记录江河脉动 智领未来浪潮 ——星图亿水以新技术推动水利信息化
丙午仲春,京华潮涌。3月,步入位于北京市海淀区中关村壹号的中科星图商业航天创新中心展厅,一场聚焦“空天赋能、智水未来”的深度思考正在进行
2026-03-27 08:37:00
中关村论坛上演“机器人总动员”
3月26日,在中关村国际创新中心,机器人餐吧的机器人在递送饮品。在2026中关村论坛年会上多品牌多形态多用途的智能机器人组团献技呈现一场科技感十足的创新盛宴3月26日
2026-03-27 07:55:00
罗技中国就“罗技G官方旗舰店发布违规内容”致歉
华商网讯 3月26日,@罗技中国 发布致歉声明:来源:华商网 相关热词搜索:
2026-03-27 07:27:00
手指轻触屏幕,一块块榫卯构件在眼前“浮”起;跟随着AI系统的提示,将斗、升、昂、枋依次安放、咬合、锁定;片刻之后,一座微缩斗拱稳稳立在掌心——与此同时
2026-03-27 07:28:00