• 我的订阅
  • 科技

中国AI今天的问题,是大模型又多又乱

类别:科技 发布时间:2023-11-21 13:56:00 来源:钛媒体APP
中国AI今天的问题,是大模型又多又乱

图片来源@视觉中国

OpenAI的开发者日活动后,GPTs模式引发了新一轮的AI热潮,开发者调用过分火爆,甚至导致OpenAI服务器一度宕机。随后,花式把玩GPTs的经验,以及围绕这种新形态的巨大争议开始涌现。中国的IT从业者、软件开发者与AI工程师也积极参与讨论,迎来了一场新的AI狂欢。

但在这种氛围下,却有一种沉默显得像个显眼包。那就是绝大多数大模型公司,似乎都沉默了。为了模仿类GPT的大模型,中国AI圈用了一年时间,雨后春笋般打造了上百个大模型。但其中能够诞生明星应用,能够推动产品创新,甚至能够拥有规模化用户的似乎都寥寥无几。当OpenAI的飞轮效应显现,这些大模型公司就有种越是模仿差距越大的感觉。于是干脆不去追新的热点,埋头把眼前能做的先做完。

记得今年年初的时候,社交网络和媒体都在讨论中国能否有大模型?

当时我们说过,这其实是个伪命题,因为中国早就有大模型。而在ChatGPT爆火之后,中国AI遇到的问题一定不是大模型太少,而是大模型过剩。

今天,这种问题开始浮现了出来。此刻中国AI行业最大的问题,就是大模型太多,而且还挺乱。

摩肩接踵的大模型

中国到底有多少AI大模型?经过一年的井喷式发展,这已经变成了一笔糊涂账。上半年的时候,答案大概是几十个。时间来到11月,有人说是一百多个,有人说是二百多个。总之,中国此刻必然是全世界拥有大模型最多的国家,远远超过美国。

但是,这一百多个大模型有人用过吗?有人对比、评测过吗?恐怕没有。因为除了几个头部大模型形成了用户规模外,其中大部分存在于开源社区,还有一部分只存在通稿里。

这就像什么呢?其实很多人不知道,根据相关数据,中国有2600万足球人口,同样居世界第一。我们无从考证数据从何而来,反正周围踢足球的人看着是不多,而国足的成绩有目共睹。

为什么会出现这么多大模型呢?

首先是今年大模型赛道好,机会难得。虽然科技板块的VC市场非常低迷,但在其他互联网创投项目普遍失效,虚拟货币被严格限制的情况下,AI大模型成为今年近乎唯一的故事。因此即便热钱不多,但还是集中涌向了大模型创业。

其次,与很多人设想的不同,大模型创业并没有真正意义上的高门槛。一旦以股权、期权等方式吸引到了合适的人才,大模型创业公司过多的费用支出。相比于其他科技领域有产品研发、用户推广、硬件化等烧钱选项,在拥有大量开放数据集、免费工具的情况下,仅仅是训练大模型并没有过高的成本门槛,并且所谓大模型项目,往往一个科研团队就可以支撑,不需要像互联网创业公司搭建较为复杂的业务体系。

此外,还有一种“刷业绩”式的大模型,极大程度增加了大模型数量。这种一般是高校、科研机构相关团队,选报大模型方面课题更容易获得立项。其结项结果发布后,大模型数量就又增加了一个。或者是大型企业上级要求做大模型,于是IT部门会根据开源的模型框架搭建一个出来,即使效果不佳,落地困难,也要进行对内对外宣传。

赛道好、成本低、需要完成任务,这几种动力,导致中国大模型越来越多,且产生效率越来越快。

但问题在于,足球人口规模可能确实很重要,但更重要的是有一支能踢进世界杯的球队。

没有希望的窄赛道

那么有人或许要问了。大模型数量说难道不能成为优势吗?我们靠数量出奇迹,说不定数量一多就能选出拔尖的来?

这恐怕并不现实。因为从种种理由来看,今天庞大的大模型规模,都是不可能持续存在。通稿打造类GPT模型而挤入下一个科技时代的美好想法,已经将AI大模型变成了一条没有希望的窄赛道。

我们可以来正视这样几个问题:

1.大模型的数量多,其实和大模型本质背道而驰。

提起大模型,我们会说它的优点是模型的泛化性、高鲁棒性,继而带来了“智能涌现”效果。我们总是惊叹OpenAI的成绩,就是因为GPT系列始终在深度挖掘模型的泛化性。也就是说,大模型的优势就是一个顶一群,用一个模型代替一堆模型,结果反而出现了数量过剩的大模型,这与大模型初衷南辕北辙,并且浪费了海量的社会资源。

2.大模型是底层技术,底层技术的玩家不可能很多。

仅仅以AI开发为例,模型之上还有AI芯片、AI框架。在过去几年,这些领域也有很多厂商布局,但最后大多不了了之。AI芯片无法出货,AI框架无人问津,能够剩下的只有头部一两家而已。大模型也是同样的道理,这是一个注定洗牌到存量很少的赛道。

3. 大模型,距离开发者很远。

绝大多数初创大模型,都会选择开源吸引开发者的模式。但现实情况是,这些模型无论是与国外开源大模型,还是国内头部大模型相比,都没有实际竞争力,无法形成规模化的开发者聚合效应。这些大模型普遍是开源时大力宣传一波吸引关注,但开发者实际体验后马上遇冷。

4.大模型,距离用户很远。

在可见的场景中,绝大多数大模型都缺乏商业化支撑,是这个赛道最大的问题。对应大模型创业型企业来说,一开局就是最艰难的局面。后来广受诟病的机器视觉公司,在开局阶段还有智能安防市场作为支撑。但大模型公司拥有的只是算法,甚至连一条可行的商业化通道都找不到。

这些问题,导致堆积了巨大数量的大模型赛道开始变得并不美好。它今天的情况是,说算法,各个创新;说参数,各个庞大;说调用,根本没人用;说商业,根本没去想。

模型一多,乱象也多

大模型一多,产业赛道开始热络起来,也必不可免出现一些问题。这就是我们说的,大模型不仅有点多,还有点乱。

由于目前阶段,有一股“大模型用不用不重要,先要拥有大模型”的思潮。因此就开始有各种方式降低大模型的开发成本,通过话术夸大价值,甚至硬蹭大模型热度,把不是大模型技术的项目包装成大模型,进而导致大模型圈子里,开始出现良莠不齐、鱼龙混杂的态势,我们可以列举其中的几种:

1.打榜刷分型大模型。由于大模型数量庞大,且实现思路基本一致,这就导致不同公司之间的差异化微乎其微。而为了凸显自己的差异化与领先性,目前通用方式是硬造一个技术术语,然后宣传通过这项技术自身项目刷新了某榜单纪录,在某测试中跑出了多少分。

事实上,大部分榜单都只测试模型的某个维度,可以进行针对性调参。打榜刷分并不难,且有比较大的操作空间。类似的,社区开发者打多少颗星,发了多少篇顶会,也都是惯用的包装方案。

2.结项为主型大模型。有很多用作课题结项,或者企业数字化成果结项的大模型。评审结束,结项成功,开源开放,这三条做到就是它们的生命终点。这类大模型不考虑应用场景与后续更新,有某种朝生夕死的精神特质。

3.动辄开源型大模型。软件开源当然是大势所趋,但随着这几年中国开源事业的兴旺发展,AI模型开源似乎变成了某种“时尚”。加上一些企业更愿意将大模型的开源与免费作为流量聚拢工具。开源,逐渐成为了低质量、低维护大模型的遮羞布。

4.冒名顶替型大模型。大模型火了之后,开始有公司打起了蹭热点的主意。于是,用并非标准预训练大模型技术冒充大模型,甚至干脆把古早的对话机器人、应用软件包装成大模型的案例屡见不鲜。用大模型的瓶子,装其他老酒,也成为了一门生意。

5.套壳变身型大模型。最近,一些创业公司套壳国外开源模型的事件引起争议。其实业界类似手法并不少见,将开源大模型进行改写和包装,摇身一变,成为自研大模型的例子非常多。

这些大模型队伍里的妖魔鬼怪,也纷纷可以通过发明术语、加强定语的方式,来宣传自己的创新能力和差异化。最终导致把真正的技术创新,淹没在了一系列的“伪装创新”当中。

中国AI之春在去掉90%的大模型之后

如果我们看美国的大模型产业结构,会发现它处在一个每层数量差异不大的金字塔结构里。即OpenAI一家独大,谷歌、微软、Meta、X保持持续竞争力,此外还有20几个较为常用,开发者群落比较活跃的大模型。

当然咱们不是说一定要照搬美国,但从中大概可以看见一个科技大国,在目前情况下大模型产业体量是什么。

中国大模型,已经在短时间内发展出了远远超过本身应有存量的大模型。数量过于庞大的大模型,一方面浪费了极大的研发、算力,以及数据资源;另一方面也蕴藏了一场并不会太久的“危机”。

在资本泡沫相对冷却之后,我们很容易看到这样的情况:忽然之间,众多大模型开始停止更新,紧接着大模型领域的公司大量倒闭。伴随着资本退场,员工待遇下降等问题开始发生,于是媒体开始唱衰大模型寒冬,社交媒体上开始冷嘲热讽AI这门技术。

这种行业猛然转冷,大概率会给真正具有竞争力、创新能力的中国AI企业带来巨大的麻烦。

但是请记住,这并不是AI不行了,而是这些AI公司和大模型项目本来就不行。

这不是AI寒冬,而是中国AI的春天刚刚要真正开始。产业优化重组后的大模型产业形态,才是真正能发挥出中国在应用创新、产品打磨、产业智能化落地等领域的优势。

在中国,相对良性的大模型产业形态,应该是有5家左右可以互相竞争的主流大模型,1到2个能够进行底层技术创新,保持全球竞争力的大模型体系,同时有一系列开源大模型作为补充,以及一些学术领域的大模型作为AI for sience的支撑。此外,还要具备较为完善的大模型配套设施,包括AI芯片、AI计算、深度学习开发框架、AI开发工具,并且这些领域都有较高的自主化程度。换言之,必须要淘汰今天超过90%的大模型。

在这些底层软硬件基础之上,应该有大量创业公司、AI开发者去探索C端和B端的大模型落地。在大模型与行业结合的垂直领域,组成推广和复制行业大模型的产业生态;在主要的C端市场,比如大模型+办公、大模型+娱乐、大模型+信息获取方面,涌入成千上万家公司,形成互联网经济之后的AI经济奇迹。

而从“百模大战”中能够留到那时的只有三种公司:具备核心技术创新的、形成平台型产业链的以及能够快速找到商业出口,形成正向资金循环的。

我们依旧笃信,有一天AI技术上会出现新的抖音、微信、office,甚至更多此前无法想象的东西。但今天绝大多数的大模型,结局恐怕只能是躺在历史空隙与开源平台上,成为大时代的小脚注。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-21 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

高质量AI开发者如何速成?百度在中国传媒大学开“AI第一课”
...日,由百度公司主办的“AI放‘大’招——人类高质量AI开发者速成季” 活动(以下简称“AI放大招”)走进中国传媒大学,为学生带来“开学AI第一课”。该校动画与数字艺术学院的师
2024-10-21 17:37:00
百度沈抖:解决算力问题,一云多芯是中国企业的必然选择
...度这样的技术服务商在做的,就是为央国企、民营企业、开发者提供从算力平台、基础大模型、大模型微调和应用平台在内的人工智能全栈能力,让大家的创新速度更快、成本更低。”沈抖说。
2024-07-20 08:00:00
开学“AI第一课”——数字人“李白”亮相中国传媒大学
...在中国传媒大学举办的“AI放‘大’招——人类高质量AI开发者速成季” 活动中亮相的数字人,在活动现场与同学们进行了一场跨越时空的诗意对话。该项目由中国传媒大学数字人研究院的吕
2024-10-20 21:17:00
阿里云CTO周靖人:中国模型界差距在缩小,此次人工智能技术浪潮才刚开始
...布,将在11月开源通义千问720亿参数模型,继续支持全球开发者开展模型和应用创新。与此同时,基于通义大模型训练的8大行业模型也已上线,分别为:通义灵码-智能编码助手、通义智文
2023-11-01 23:02:00
华为云正式发布盘古大模型3.0 打造世界AI另一极
...型迎来重大升级。华为常务董事、华为云CEO张平安在华为开发者大会2023上发布了华为云盘古大模型3.0,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服务。会上,华为
2023-07-07 18:22:00
昇思MindSpore 2.3全新发布
...态。昇思MindSpore作为国内主流开源框架,打造充满活力的开发者社区,致力于推动中国人工智能产业的进步。近两年包括昇思MindSpore在内的开源框架产品不断发展
2024-03-24 17:47:00
大模型迎来爆发节点,谁来帮中国AI产业打好地基?
...近年来,随着科技业对于3D引擎需求的增长,越来越多的开发者开始将Unity用于非游戏领域的开发,如汽车智能座舱、数字孪生、元宇宙等等。特别是在汽车领域,包括闪马智能在内的众多
2023-07-10 19:02:00
OpenAI“断供”,谁才是最大赢家
...技术理想与现实利益的冲突。2023年3月,OpenAI允许第三方开发者调用API,借用ChatGPT能力,从而刺激了国内企业进行相关的AI开发
2024-07-01 11:42:00
百度智能云晒大模型落地成绩单:5个第一!
...文心快码已经服务超过1万家企业客户,帮助数百万中国开发者提升编码效率,整体提升研发效率20%。 总结来看,百度智能云这波大升级,方方面面都是以企业实际落地需求为核心,覆盖底
2024-09-26 13:34:00
更多关于科技的资讯:
8月28日,秦皇岛市海港区阿尔勃特空间智能(河北)视觉技术有限公司展示区,公司副总经理朱晓明用语音进行操作,要求机器人“鲁班1号”打好对应工位的螺丝
2025-09-10 08:27:00
第六届中国人工智能大赛在厦启动 描绘“数实融合”新图景
扫码了解详情厦门网讯(厦门日报全媒体记者 翁华鸿)在生成式人工智能持续迭代演进、与实体经济深度融合的背景下,一场高规格的人工智能盛会再度在厦门启航
2025-09-10 08:27:00
上海人工智能实验室主任、首席科学家周伯文:“人工智能+供应链”创新成果将在厦涌现
周伯文。(厦门日报全媒体记者 王火炎 摄)厦门正在全力推进国家人工智能应用中试基地建设,一批“人工智能+供应链”的创新成果有望在此加速涌现
2025-09-10 08:58:00
随着中报陆续披露,在今年国内医疗器械行业普遍承压的大环境下,鱼跃医疗交出了一份营收、净利双增的亮眼答卷,其中海外业务同比增长26
2025-09-10 09:17:00
上海时尚之都的形象深入人心,时装之外,上海还是一座美妆之城。今年8月,胡润研究院发布《2025 CBE·胡润中国彩妆品牌TOP50》报告
2025-09-10 10:55:00
当消费市场从规模竞赛转向价值深耕时,一场以民生需求为罗盘的产业变革正加速演进。国家统计局日前发布的数据显示,今年1—7月
2025-09-10 10:55:00
青岛锐智智能装备科技股份有限公司:科技创新引领高质量发展
鲁网9月10日讯(记者 葛万彩)在国际国内市场竞争异常激烈的形势下,青岛锐智智能装备科技股份有限公司靠科技人员自主研发
2025-09-10 11:20:00
AirPods Pro 3 登场了!耳机支持测心率,实时翻译功能国行暂不支持
在今日凌晨举行的“前方超燃”苹果发布会上,AirPods Pro 3正式亮相。这款耳机不仅延续了苹果经典的简约设计和出色音质
2025-09-10 11:24:00
重大变革!iPhone17将仅支持eSIM,不再配备实体卡槽,苹果官网默默下架iPhone16pro
9月10日,在凌晨举行的苹果2025秋季新品发布会上,苹果宣布,“史上最薄”iPhone Air 将在全球范围内统一采用仅支持eSIM的设计
2025-09-10 11:24:00
大众网记者 徐浩 通讯员 李琛 潍坊报道近年来,随着大数据、云计算、人工智能等技术的快速发展,保险行业数字化转型步伐持续加快
2025-09-10 11:49:00
高端成效凸显!深圳首家卡萨帝体验中心开业,套购占比超6成
下半年以来,伴随卡萨帝高端化战略布局的持续深化,全国城市体验中心加速落地,战略成效进一步凸显。8月31日,位于深圳市福田区的深圳首家卡萨帝城市体验中心正式开业
2025-09-10 14:14:00
加加酱油七年减盐路引领行业革新,净利润跃升129%书写转型典范
今日,记者从宁乡市获悉,当中国调味品行业仍在价格战的泥潭中挣扎时,加加食品(002650.SZ)用一份亮眼的半年报,为行业开辟出一条价值增长的新路径
2025-09-10 14:16:00
“佳直播”携手爱奇艺打造明星感4K超高清直播间,助力内容电商激活商业价值
2024年,我国直播电商市场规模已达5.8万亿元,用户规模突破5.97亿,业态早已从实物商品销售扩展至本地生活服务、虚拟内容付费等多元领域
2025-09-10 14:17:00
掌阅科技17周年庆,全面布局多元内容,探索数字化创新新机遇
2025年,掌阅科技迎来成立17周年,正式发布全新使命“让创作点亮美好时光”,同时启用全新Slogan“悦享美好时光”
2025-09-10 14:18:00
中新经纬9月10日电 据中国移动官网消息,10日中国移动发布《关于部分国际漫游套餐产品更新调整的公告》称,自2025年9月16日0时起
2025-09-10 14:41:00