• 我的订阅
  • 科技

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

类别:科技 发布时间:2023-11-14 17:11:00 来源:搜狐科技

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

出品 | 搜狐科技

作者 | 梁昌均

国内大模型再陷“套壳”争议。阿里巴巴前副总裁、知名AI框架大牛贾扬清发朋友圈,感慨做小公司不容易,希望国内企业如果就是开源的模型结构,不要做换名伪装,免得做多余的适配工作。

根据贾扬清的朋友圈,他表示有某海外客户要其公司帮他们适配某国内大厂的新模型,但后来有朋友告知,这个大厂新模型完全就是LLaMA的架构,但为了表示不一样,把代码里面的名字从LLaMA改成了他们的名字,然后换了几个变量名。此外,海外也有工程师直接指出了这一点。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“我们是小公司也不想得罪大佬们,名字我就不说了,不过各位大佬,开源社区不容易,如果你们就是开源的模型结构,求高抬贵手就叫原来的名字吧,免得我们还做一堆工作就为了适配你们改名字。”贾扬清说。

前述消息在业内传开后,国内不少基于开源的LLaMA的国产大模型纷纷躺枪。但贾扬清所说的“大厂”到底是谁并不定论,他还特别声明到不是老东家阿里。LLaMA是Meta在今年开源的系列大模型,参数包括13B、65B等。

不过,业内的怀疑对象指向刚发布首款预训练大模型Yi-34B的零一万物,其是李开复在今年7月入局AI大模型新成立的公司,由李开复牵头创办并担任CEO。

搜狐科技注意到,零一万物开源发布的Yi-34B模型目前在Hugging Face的Open LLM Leaderboard开源大语言模型排行榜排名第一。但此前有开发者在Hugging Face社区的Yi-34B项目讨论区留言称,除了两个张量被重新命名外(input_layernorm 和 post_attention_layernorm),Yi完全使用了LLaMA的架构。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“因为围绕LLaMA架构有大量的投资和工具,所以对张量使用相同的名称是有价值的。开源社区肯定会重新发布Yi,并重新命名张量,以便有一个符合LLaMA架构的版本。我们希望您能考虑在该模型获得大量采用之前,在您的官方模型中采用这一更改,以便它最终能够享受它应得的采用。”该留言称。

对于市场质疑,零一万物方面对搜狐科技回应称,GPT是一个业内公认的成熟架构,LLaMA在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时基于零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。

零一万物还表示,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的 AI infra 能力等,投入了大量研发和打底工作,这些工作往往比起基本结构能起到更大的作用跟价值,这些也是零一万物在大模型预训练阶段的核心技术护城河。

“在大量训练实验过程中,由于实验执行的需要对代码做了更名,我们尊重开源社区的反馈,将代码进行更新,也更好的融入Transformer生态。”零一万物称,非常感谢社区的反馈,希望和大家携手共创社区繁荣,Yi Open-source 会尽最大努力持续进步。

对于Hugging Face上提到的留言,零一万物有关负责人也对其作出了回复,称会按照留言的建议,把张量的命名从Yi改为LLaMA,保证准确度和透明度。

阿里前副总裁贾扬清吐槽国产大模型“套壳”,李开复公司回应称有借鉴公开成果

“这个命名问题是我们的疏忽。在大量的实验中,我们对代码进行了多次重命名,以满足试验要求,但在推出发行版前没有把名字换回来。”该回应称,零一万物将加强流程,保证这样的失误不会再次发生,并将检查所有代码,确保其它没有问题。

零一万物在11月初正式发布首款预训练大模型 Yi系列模型,包含34B和6B两个版本,其中34B模型版本开源。零一万物当时宣称,根据 Hugging Face 英文开源社区平台和C-Eval中文评测的最新榜单,Yi-34B预训练模型成为全球开源大模型“双料冠军”,这也是迄今为止唯一成功登顶 Hugging Face 全球开源模型排行榜的国产模型。

此前,国内不少大模型都陷入过“套壳”质疑,不少企业正是基于开源模型(特别是LLaMA系列)做微调,包括二次训练等,也有企业直接基于开源模型做应用层的开发,因此研发成本更低,但往往缺乏技术护城河,不被市场看好。

OpenAI CEO Sam Altman此前就表示,“套壳”OpenAI的公司活不长久,因为OpenAI已经在解决模型本身的问题,同时这些仅在成本和速度上与OpenAI一较高下的公司,竞争优势并不会长久且持续,企业必须提供真正独特的价值。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-14 20:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

李开复回应旗下AI独角兽陷“套壳”争议:起步受益于开源,会进步
李开复创办的AI公司零一万物(01.AI)近日陷入风波。11月15日,创新工厂董事长兼CEO李开复在其微信朋友圈转发了旗下零一万物对于日前“套壳”争议的官方回应
2023-11-16 16:45:00
李开复旗下 AI 公司“零一万物”开源 Yi 大模型被指抄袭 LLaMA
IT之家 11 月 14 日消息,创新工场董事长兼 CEO 李开复于今年创办了 AI 大模型创业公司“零一万物”,该公司已推出Yi-34B 和Yi-6B 两个开源大模型
2023-11-14 17:00:00
大模型价格战“卷”向何方?|深度
...模型降价对创业公司影响几何时,国内AI圈两个“顶流”李开复与王小川的表态耐人寻味。百川智能创始人王小川认为,如果(大模型)是面向B端企业客户,那往后就是直接卖云服务的方式,中
2024-05-25 10:34:00
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...| 周鑫雨编辑 | 杨轩2023年11月6日,由创新工场董事长兼CEO李开复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”
2023-11-06 12:13:00
AI大模型诸神之战:总有人要成功,为什么不能是我们?
...前众多科技圈大佬争相加入大模型竞赛的境况,王慧文、李开复、王小川......一串串如雷贯耳的名字纷纷入局,经历了三年疫情之后,科技圈又迎来了久违的创业热潮。这些连续创业者们成
2023-04-13 10:35:00
大模型“自杀式降价”,大厂为抢生意开打价格战
...割市场。难道这一幕又要在大模型上演?尽管零一万物CEO李开复等大佬公开呼吁,大模型要避免OFO式流血烧钱的打法,可价格战一旦开打,不分出个胜负就不会轻易停下。在一些业内人士看
2024-05-31 13:58:00
ChatGPT浪潮之下 BAT迎来重塑时刻
...及创业大佬也都现身其中。3月19日,创新工场董事长兼CEO李开复在朋友圈高调宣布,正在亲自筹组中文版ChatGPT公司“Project AI 2
2023-04-17 10:59:00
ChatGPT模型“大跃进”,各大电商平台重金入场有何变局?
...人物李岩、阿里贾扬清、搜狗王小川等入局ChatGPT之后,李开复近日也宣布正亲自筹组中文版ChatGPT公司“Project AI 2
2023-04-24 11:27:00
文 | 周鑫雨编辑 | 邓咏仪距李开复发出AI英雄帖,过去了整整106天。2023年3月19日,创新工场董事长兼CEO李开复在朋友圈宣布“亲自筹组Project AI 2
2023-07-03 19:28:00
更多关于科技的资讯:
增压好的热水器推荐:万和多款热水器待你选择
在城镇化加速与高层住宅普及的当下,老旧小区管道老化、高层建筑水压衰减等问题愈发突出,不少家庭正遭受 “细流澡”“忽冷忽热” 的沐浴困扰
2025-10-30 08:16:00
创新,是让世界重新认识中国制造
“创新”,这个词我们每天都在说。要让世界记住中国制造的创新,一定是要让人们能看得见、记得住、感受到。我给大家分享几个小故事
2025-10-30 08:35:00
河北日报讯(记者孙青)为激发青年创业活力,点燃青年创业梦想,日前,团石家庄市委正式启动“青年创业训练营——青年小店孵化计划”
2025-10-30 08:36:00
当故宫的红墙金瓦凝缩成书签的精致纹路,当敦煌的飞天壁画跃然咖啡杯的杯身,博物馆中的千年文明正通过文创产品打开新的传承通道
2025-10-30 08:44:00
校宝智慧校园发布招生智能化解决方案,为民办教育注入增长新动能
2025年10月29日,校宝智慧校园正式推出面向民办、国际化学校的招生智能化解决方案,包含流量获取、线索转化、组织建设与数据决策四大核心板块
2025-10-30 09:10:00
Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话
近日,Soul App AI团队(Soul AI Lab)正式开源播客语音合成模型SoulX-Podcast。该模型是一款专为多人
2025-10-30 09:10:00
服务效能持续提升 中老年多元化保障需求凸显近日,中宏保险正式发布了《2025年第三季度中宏保险个险理赔服务报告》(以下简称"报告")
2025-10-30 09:10:00
AI+人工双核验:深瞳查重如何以精准核查守护科研诚信
在科研诚信日益重要的今天,图片查重已成为维护科研诚信的关键环节手段。作为国内首家推出图片查重服务的深瞳查重,深瞳查重始终将结果的准确性和可靠性放在首位
2025-10-30 09:10:00
德明利亮相安博会,推出面向智能安防的多维度存储解决方案
10月28日,深圳CPSE安博会在福田会展中心顺利开幕,展会聚焦AI与大数据的智能安防创新。德明利携工业级存储产品及多维矩阵方案亮相
2025-10-30 09:10:00
碧欧宝亮相2025德国品牌周,于外滩百年地标演绎德式健康美学
2025年10月23日,由德国工商总会主办的“Discover Germany 德国品牌周”在外滩百年地标老市府隆重启幕
2025-10-30 10:10:00
留学常用APP与交友软件推荐:学习、生活、社交一站式搞定
即将远赴海外求学,除了收拾行囊,在手机里提前装好实用的留学APP,也成了许多准留学生的必备功课。面对应用商店里海量的留学常用APP选择
2025-10-30 10:56:00
工商银行联合腾讯云发布《中国金融生成式AI多模态内容鉴伪与安全防御白皮书(2025)》
随着生成式人工智能浪潮全面兴起,金融行业在加速迈向“AI原生”时代的同时,也面临多模态深度伪造内容带来的新型安全挑战。利用生成式AI合成的语音
2025-10-30 12:08:00
片仔癀黄芩多肽洗护新品亮相漳州,以东方智慧开启舒缓新“净”界
10月23日,东方新国妆代表品牌——片仔癀化妆品,在品牌发源地漳州隆重举办黄芩多肽系列新品发布会。活动以“亮剑·向新而生”为主题
2025-10-30 12:11:00
灵芝孢子油三大品牌 2025年权威推荐与选购指南
灵芝孢子油作为养生市场的明星产品,其品质差异直接影响消费者体验。本文基于实测数据与行业深度调研,为您梳理灵芝孢子油三大品牌
2025-10-30 12:11:00
随着现代人久坐、运动损伤、年龄增长等因素影响,关节健康问题日益突出。据《中国骨关节炎临床流行病学调查报告》显示,中国40岁以上人群骨关节炎患病率高达46
2025-10-30 12:13:00