• 我的订阅
  • 科技

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

类别:科技 发布时间:2023-11-14 17:11:00 来源:搜狐科技

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

出品 | 搜狐科技

作者 | 梁昌均

国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得做多余的适配工作。

根据贾扬清的朋友圈,他表示有某海外客户要其公司帮他们适配某国内大厂的新模型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“我们是小公司也不想得罪大佬们,名字我就不说了,不过各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。”贾扬清说。

前述消息在业内传开后,国内不少基于开源的LLaMA的国产大模型纷纷躺枪。但贾扬清所说的“大厂”到底是谁并不定论,他还特别声明到不是老东家阿里。LLaMA是Meta在今年开源的系列大模型,参数包括13B、65B等。

不过,业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。

搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging Face的Open LLM Leaderboard开源大语言模型排行榜排名第一。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称,除了两个张量被重新命名外(input_layernorm 和 post_attention_layernorm),Yi完全使用了LLaMA的架构。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“因为围绕LLaMA架构有大量的投资和工具,所以对张量使用相同的名称是有价值的。开源社区肯定会重新发布Yi,并重新命名张量,以便有一个符合LLaMA架构的版本。我们希望您能考虑在该模型获得大量采用之前,在您的官方模型中采用这一更改,以便它最终能够享受它应得的采用。”该留言称。

对于市场质疑,零一万物方面对搜狐科技回应称,GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时基于零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

零一万物还表示,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI infra 能力等,投入了大量研发和打底工作,这些工作往往比起基本结构能起到更大的作用跟价值,这些也是零一万物在大模型预训练阶段的核心技术护城河。

“在大量训练实验过程中,由于实验执行的需要对代码做了更名,我们尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。”零一万物称,非常感谢社区的反馈,希望和大家携手共创社区繁荣,Yi Open-source 会尽最大努力持续进步。

对于Hugging Face上提到的留言,零一万物有关负责人也对其作出了回复,称会按照留言的建议,把张量的命名从Yi改为LLaMA,保证准确度和透明度。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“这个命名问题是我们的疏忽。在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来。”该回应称,零一万物将加强流程,保证这样的失误不会再次发生,并将检查所有代码,确保其它没有问题。

零一万物在11月初正式发布首款预训练大模型 Yi系列模型,包含34B和6B两个版本,其中34B模型版本开源。零一万物当时宣称,根据 Hugging Face 英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型成为全球开源大模型“双料冠军”,这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

此前,国内不少大模型都陷入过“套壳”质疑,不少企业正是基于开源模型(特别是LLaMA系列)做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低,但往往缺乏技术护城河,不被市场看好。

OpenAI CEO Sam Altman此前就表示,“套壳”OpenAI的公司活不长久,因为OpenAI已经在解决模型本身的问题,同时这些仅在成本和速度上与OpenAI一较高下的公司,竞争优势并不会长久且持续,企业必须提供真正独特的价值。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-14 20:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
李开复创办的AI公司零一万物(01.AI)近日陷入风波。11月15日,创新工厂董事长兼CEO李开复在其微信朋友圈转发了旗下零一万物对于日前“套壳”争议的官方回应
2023-11-16 16:45:00
李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA
IT之家 11 月 14 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出Yi-34B 和Yi-6B 两个开源大模型
2023-11-14 17:00:00
大模型价格战“卷”向何方?|深度
...模型降价对创业公司影响几何时,国内AI圈两个“顶流”李开复与王小川的表态耐人寻味。百川智能创始人王小川认为,如果(大模型)是面向B端企业客户,那往后就是直接卖云服务的方式,中
2024-05-25 10:34:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...| 周鑫雨编辑 | 杨轩2023年11月6日,由创新工场董事长兼CEO李开复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”
2023-11-06 12:13:00
AI大模型诸神之战:总有人要成功,为什么不能是我们?
...前众多科技圈大佬争相加入大模型竞赛的境况,王慧文、李开复、王小川......一串串如雷贯耳的名字纷纷入局,经历了三年疫情之后,科技圈又迎来了久违的创业热潮。这些连续创业者们成
2023-04-13 10:35:00
大模型“自杀式降价”,大厂为抢生意开打价格战
...割市场。难道这一幕又要在大模型上演?尽管零一万物CEO李开复等大佬公开呼吁,大模型要避免OFO式流血烧钱的打法,可价格战一旦开打,不分出个胜负就不会轻易停下。在一些业内人士看
2024-05-31 13:58:00
ChatGPT浪潮之下 BAT迎来重塑时刻
...及创业大佬也都现身其中。3月19日,创新工场董事长兼CEO李开复在朋友圈高调宣布,正在亲自筹组中文版ChatGPT公司“Project AI 2
2023-04-17 10:59:00
ChatGPT模型“大跃进”,各大电商平台重金入场有何变局?
...人物李岩、阿里贾扬清、搜狗王小川等入局ChatGPT之后,李开复近日也宣布正亲自筹组中文版ChatGPT公司“Project AI 2
2023-04-24 11:27:00
文 | 周鑫雨编辑 | 邓咏仪距李开复发出AI英雄帖,过去了整整106天。2023年3月19日,创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2
2023-07-03 19:28:00
更多关于科技的资讯: