• 我的订阅
  • 科技

这一代AI追随者的窘境

类别:科技 发布时间:2023-11-27 15:12:00 来源:36氪

前不久,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。

很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。LLaMA是Facebook母公司meta旗下开源免费商用的开源大模型。

贾扬清的朋友圈之所以流传,很大程度是因为其戳破了AI圈一个人人皆知的秘密:所谓的自研大模型,其实“水分”很大。

一位投资人曾对「暗涌Waves」说:两个月就上线一个大模型,“想想就不对不是嘛”。早在今年五月的Waves大会上,中国人民大学高瓴人工智能学院卢志武教授就指出,所谓“国产大模型的春天”,不过是很多公司在“微调国外底座模型”的假象。

尽管从现实来看,微调似乎是不得而为之的。原因可以很宏观:openAI如此凶狠,除非你能超越它,否则做半天,很可能也不值钱,甚至不如开源。原因也可以很具体:这是一个没有两三亿美金几乎上不了牌桌的游戏,让一个初创公司从头训练大模型几乎是痴心妄想。

昨天的讨论中,青年AI学者符尧也在一个群中表达了自己的理解,他认为“如果因为架构不变而批评一个模型没有创新,这样的批评对任何一个模型都是不公正的”,因为所有的模型都是在前者的基础上接力完成的,“每个模型架构基本都大同小异,但效果完全不同”。

有投资人表示,在Hugging Face 上,架构一样但名字不同的模型的确很多,因为大部分改动的是训练方法以及数据配比。

贾扬清在后来的声明中也进一步解释道:他批评的并不是模型架构不改变,但是生生改了个名字。改名会带来的麻烦是,原来适配LLaMad的代码可以用,而现在则要做大量工作来适配新名字。

这起风波或许偶然,但也呈现出了在追赶OpenAI过程中,速度的紧张与边界的模糊。

对于中国的AI创业者——尤其是应用型创业者来说,作为新一代AI技术的追随者,他们正在进入的是一种前所未有的难以与OpenAI区分“你我”的模糊地带。

前几天召开的OpenAI开发者大会是一次最新的导火索。去年底,ChatGPT3.5横空出世后,中国的AI创业者有过几波集中的人头攒动。最早,无论是大厂还是创业公司,都有一种大模型执念。但GPT4的快速发布以及大厂进击后,除了Minimax和智谱AI,因为“起跑早,已经有相对成熟的大模型产品出来”,以及极少数其他公司,多数人快速放弃了大模型路线。

当时还存在、且大放光彩的王慧文创立的光年之外,以及王小川的百川智能,也很快选择了大模型和基于模型应用两条线并进。

但被称为“AI界春晚”的OpenAI开发者大会,预示了一大批初创公司的必然徒劳。这场大会不仅有会前流传的GPT-4 Turbo和更强大的全新功能,还将推出GPT store,以及自定义GPT(GPTs),而用户也可以创建自己的GPT。

这意味着,在中国创业者最擅长的应用这个赛道上,也极可能寸草不生:如果你没有快速掌握垂直的场景、数据,可能随时被吞噬。

这就是这一代AI追随者的窘境:新一代AI应用型产品定义,必然要结合大模型的能力边界,而关隘是,大模型的能力始终在快速演化,OpenAI始终在演化。

前端的变动不居,后段的应用就如同是沙滩上的高塔。

今年5月,某知名初代产品经理还信心十足地表示,Chatgpt3.5发布之后,中国的产品经理早已在行动。而这次OpenAI发布者大会之后,面对“AI创业者的机会还剩多少”的提问,他也只回复了一个哭笑不得的表情包。

过去在互联网和移动互联网时代的传递链条上,从copy to China到copy from China,中国的创始人凭借的是庞大的市场和用户群,孕育出的庞大产品经理,整个过程可谓是行云流水,异常丝滑。而在新的AI时代, 这种珠联璧合显然已经被打断。新一代的产品经理,不仅仅需要产品能力,还要充分理解大模型以及数据。

当然还有一条众所周知的变量在于:与技术与产品边界定义权一起失效的外部环境。

那么在当下,一个中国AI创业者、尤其是应用类公司,该怎样找到解法?

一个乐观者会告诉你,大模型一定分地域的,所以中国的大模型与OpenAI并不一定有直接竞争。

其次,那些基于AI的原生应用、社区以及掌握垂直场景、数据的公司,也会存在回旋的余地与大口呼吸的空隙。事实上,很多应用层创业者,也都来自教育、医疗、游戏等垂直领域。AI的进展也在进一步引燃自动驾驶、电动汽车、机器人等领域。

很多人提到“数据壁垒”之说:一种是垂直行业非公开数据积累,而ChatGPT主要是泛行业的公开数据;一种是用户私有数据的积累,“了解越多,就越懂你”。

这个逻辑大概率是成立的。因为在未来的垂直场景、数据的争夺战中,必然会迎来掌握崭新技术的AI创业者与手握数据和客户资源的传统企业服务公司、垂直领域龙头公司的一场厮杀。

让我们回到问题的最初。一位AI投资人曾向我们提出一个问题:“在OpenAI这个前所未有的新物种面前,谁又不是抄作业的那一个?”从模仿到创新,是大部分后发地区的必然路径,甚至这也是多数人生的路径。

其实更务实地说,问题应该是:怎样才是更有道德的“抄作业”?

在瞬息万变的创新生态里,往往都是迅猛且边界混乱的,过度“苛求规范”,某种意义的确会影响效率甚至扼杀创新。但即便如此,也应存在底线。

就像在最早那条朋友圈的最后,贾扬清发出的具体请求:各位大佬,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还要做一堆工作就为了适配你们改名字……

保留原来的名字、或者多加个声明,就是这个时代里一份难得的体面。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-27 18:45:23

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

技术大牛AI创业:一半意难平,一半现实
...品研发的速度和变现的速度,亦称为先发优势。一位连续创业者述道,当一项新的技术面市之前,先有学术论文出来,然后在技术人员交流的网站上,会出现技术爱好者做的app或demo,此时
2023-08-04 15:00:00
潮涌30年,中国互联网未来更广阔
...“串联”出互联网蓬勃发展的时代篇章,中国由互联网“追随者”跃升为“引领者”,如今更是在人工智能等新技术引领的数字浪潮下向着更加美好的未来奔涌而去。三十而立,互联网改变中国,中
2024-05-06 05:19:00
李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
...前“套壳”争议的官方回应,并在配文中写道:“全球大模型架构一路从GPT2-->Gopher-->Chinchilla-->
2023-11-16 16:45:00
大模型“自杀式降价”,大厂为抢生意开打价格战
...态,必须找到新的商业模式。5月22日,百川智能发布最新一代基座大模型Baichuan 4,创始人王小川在媒体交流会上表示,核心要看背后的商业模式是什么,如果是做to B服务的
2024-05-31 13:58:00
...,网络空间法制化程度不断提高,中国已经从网络安全的追随者变为引领者。特别是刚刚审议通过的《生成式人工智能服务管理暂行办法》,体现了网络治理的中国智慧,一方面坚持依法治网,一方
2023-07-16 20:04:00
Sora有何本领?能复制ChatGPT般的创业热潮吗?
...效应,但市场上似乎并未复制出创业之风,取而代之的是创业者的理性思考。一位AI创业者对壹度Pro表示,文生视频并非新鲜事,但国内现有的文生视频最大的硬伤在于“时长”,其次是目前
2024-02-26 11:25:00
算力卡不住大模型的脖子
...BERT、GPT等AI大模型,但在GPT模型的商业化投入方面确实是追随者。“作为AI科学家,对GPT这样的技术我们肯定不能错过
2023-04-29 02:00:00
AI“百模大战” 英伟达稳坐钓鱼台
...体称其为「百模大战」。还有不少科技公司高管也与其他创业者一样跳入 AI 创业的浪潮,比如谷歌 AR/VR 负责人 Clay Bavor
2023-04-18 17:55:00
AI大模型诸神之战:总有人要成功,为什么不能是我们?
...年疫情之后,科技圈又迎来了久违的创业热潮。这些连续创业者们成名已久,又都不约而同地瞄准了同一个目标,那就是打造中国版的ChatGPT,百度、阿里、360等巨头公司已经率先“把
2023-04-13 10:35:00
更多关于科技的资讯: