• 我的订阅
  • 社会

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

类别:社会 发布时间:2024-06-05 11:04:00 来源:都市快报橙柿互动

#斯坦福抄袭中国大模型##斯坦福团队道歉#,今天下午,两个词条分别冲上微博热搜第2和第5位,引发热议。

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

斯坦福团队承认抄袭中国大模型冲上热搜

简单说,就是国外一个AI团队主导的开源大模型,被证实套壳抄袭了国内清华系明星创业公司面壁智能的开源模型。目前,团队已经公开道歉,并下架模型。

斯坦福AI团队抄袭中国大模型

5月29日,一个来自斯坦福的AI团队在网上发布文章《Llama 3-V: Matching GPT4-V with a 100x Smaller Model and 500 Dollars》,并开始广而告之:成功训练出一个SOTA多模态模型Llama3-V,性能比GPT-4V、Gemini Ultra、Claude Opus更强,而训练成本仅需500美元。后三个大模型,都是全球范围知名的多模态“巨无霸”。

由于团队成员拥有斯坦福(其中两人是斯坦福本科生)、特斯拉、SpaceX、亚马逊等亮眼背景,Llama3-V第一时间被推到了聚光灯下,登上开发者社区Hugging Face(抱抱脸)首页,引发众多开发者关注。

很快,有用户开始在Hugging Face以及社交平台X上提出质疑:Llama3-V是否套壳MiniCPM-Llama3-V 2.5?后者为面壁智能推出的开源端侧多模态模型,5月21日刚刚发布。

事情迅速发酵。经过一些开发者的比较,两者在模型结构、代码、配置文件等方面完全相同,只是进行了一些重新格式化,并将部分变量重新命名。

面对质疑,斯坦福团队一开始选择“辩解”:只是使用MiniCPM-Llama3-V 2.5的tokenizer(分词器),并且宣称在后者发布前就已开始这项工作。

6月2日晚,面壁智能团队确认抄袭事实。

面壁智能首席科学家刘知远在知乎上表示:“已经比较确信Llama3-V是对我们MiniCPM-Llama3-V 2.5套壳。”

而CEO李大海也在朋友圈发文:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

CEO李大海对此事表示遗憾

目前,Llama3-V团队的其中两位成员Aksh Garg和Siddharth Sharma,也就是那两位斯坦福本科生,已在社交平台上向面壁智能团队道歉:“我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

Llama3-V团队的其中两位成员在社交平台道歉

同时,Aksh Garg解释Siddharth Sharma和自己主要是负责推广,编写代码的是Mustafa Aljadery,而他目前已经联系不上。

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

目前已经看不到Mustafa Aljadery的社交平台内容

核心证据:来自战国时期的清华简

在朋友圈发文中,李大海给出确认抄袭的一大理由是:经过测试,面壁智能团队发现Llama3-V不仅能识别“清华简”的战国古文字,而且在犯错的地方也和MiniCPM-Llama3-V 2.5如出一辙。

公开资料显示,清华简,是清华大学于2008年7月收藏的一批战国竹简,属于中国学术史上先秦文献的重大发现。此后,清华大学成立专门研究团队,先后在已故著名历史学家、考古学家、古文字学家李学勤及黄德宽教授的带领下开展简文整理研究,以复原这批幸免于焚书坑儒与秦汉战火的重要历史“拼图”。

这些年里,研究者们在一间不足20平方米的小屋里,用一面42英寸显示屏读简,整理成果以一年一辑的速度出版公布,至今已出版13辑。诸子思想、历史文化、天文历法、律法术数、医学方技……中国传统文献中的经史子集均有发现,竹简的内容逐渐清晰起来。

据李大海解释,此次识别清华简的训练数据,采集和标注均由清华NLP实验室和面壁智能团队完成。“耗时数月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,融合进模型中”,且数据尚未对外公开。

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

Llama3-V在犯错的地方也和MiniCPM-Llama3-V 2.5如出一辙

此外,Llama3-V、MiniCPM-Llama3-V 2.5两个模型在高斯扰动验证(一种用于验证模型相似性的方法)后,在正确和错误表现方面都高度相似。

巧的是,上周日清华大学在官方微信公众号上转载了新华社《瞭望》新闻周刊刊发的特稿《破译千年竹简 求索文明密码》,回忆这2500位先秦“客人”来到清华的故事。

文中提到,清华简整理研究工作的难点之一,就是“认字”。“清华简是战国时期楚国人所写,其中有些字没有流传下来,有的字形是首次出现,即便将一些字辨识出来,其字义的理解也需要下大功夫去研究,因为这些竹简文献只有极少数可与传世文献对照参证。因此,‘考字释词’耗费巨大精力,把字词探究清楚了,做到文通字顺,才能真正了解文献记载了什么内容,进而判断其价值。”

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前

清华校园内的战国竹筒

橙柿互动·都市快报 记者 童蔚

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-05 15:45:11

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联
美国斯坦福大学的一个AI(人工智能)团队就抄袭中国大模型致歉。近日,由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V
2024-06-04 22:12:00
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...“‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上
2024-06-05 13:55:00
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态
2024-06-04 14:35:00
...远联合创办“面壁智能”。值得一提的是,2024年,美国斯坦福大学三名学生组成的一个人工智能团队,抄袭中国大模型公司“面壁智能”的开源成果“小钢炮”MiniCPM-Llama3-V 2
2025-05-30 07:47:00
马斯克:SpaceX星舰已准备好第四次试飞;字节跳动任命前华纳兄弟高管担任全球总法律顾问|AI daily早新闻
...4日讯今日AI daily早新闻主要内容有:面壁智能CEO发文回应斯坦福某AI团队“抄袭”:感到遗憾;Arm CEO
2024-06-04 09:56:00
雅培心脏瓣膜修复系统获FDA批准;斯坦福AI模型研发新药
...太空活动标准,促进国际合作,保障太空探索安全。NO.5 斯坦福AI模型研发出抗生素新药据外媒,斯坦福医学院和麦克马斯特大学研究人员在生成式AI抗生素研发领域获得突破性进展。他
2024-04-04 22:40:00
车企老总下场做IP的时代,AI大模型能改变营销内卷吗?
最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训
2024-06-06 13:44:00
欧盟通过AI监管草案后,斯坦福研究显示:全球主流AI模型均不达标 | 最前线
...了广泛争议。如今,监管脚步正在快速迫近。6月中旬,斯坦福大学AI研究实验室发布了一项对AI大模型的研究的结果。研究以十个AI大模型为研究对象,评估他们是否达到欧盟AI法案的标
2023-06-27 16:37:00
斯坦福发布ai基础模型“透明度指标”
10月20日消息,斯坦福大学日前发布了AI基础模型“透明度指标”,其中显示指标最高的是Meta的Lama2,但相关“透明度”也只有54%,因此研究人员认为,市面上几乎所有AI模型
2023-10-21 16:47:00
更多关于社会的资讯:
南报网讯(通讯员周利钢潘欣辰记者王茸)10月22日凌晨2时许,一辆黑色小车在行驶到沪宁高速南京收费站进城方向马群公安检查站附近
2025-11-05 08:16:00
南京大学、影石创新、栖霞区三方共建创新中心“智能影像第一股”落子栖霞南报网讯(记者朱旖旎通讯员葛若凡卢雨文)一段“母校与学子”的佳话在栖霞区续写新篇——11月4日下午
2025-11-05 08:17:00
南报网讯(通讯员杨萍记者王茸)面对交警的检查,驾驶员信誓旦旦称自己没有喝酒只是吃了槟榔,企图蒙混过关,然而酒精呼气检测仪上醒目的数值
2025-11-05 08:17:00
□罗立彬李萍党的二十届四中全会指出,“十五五”时期是基本实现社会主义现代化夯实基础、全面发力的关键时期,在基本实现社会主义现代化进程中具有承前启后的重要地位
2025-11-05 08:17:00
夯实6类技术支柱、赋能5大业务领域、衍生N个智能体中国华电“华电智”大模型在宁发布南报网讯(通讯员刘婕记者徐宁)夯实6类技术支柱
2025-11-05 08:18:00
厦门网讯(厦门日报记者 邬秀君)昨日下午,第三届中国(厦门)马约翰艺术大展在厦门海沧金沙书院隆重启幕。市人大常委会党组副书记
2025-11-05 08:22:00
为这份雨中暖情点赞! 残疾老人摔倒后无法起身 黄骅车主护送老人回家
“太谢谢了真是遇到好人了”近日,沧州黄骅晚上八点多,小雨淅沥车主刘占杰开车载着儿子回家途经天健湖公园南门附近时她注意到一位老人瘫坐在湿漉漉的路边努力想要站起来却没有成功她没有犹豫
2025-11-05 09:39:00
大皖新闻讯 “听说11月12号到14号芜湖中小学放秋假,连周末能休5天,我都跟孩子商量好去南京研学了,结果学校一点通知都没有
2025-11-05 11:04:00
鲁网11月5日讯(记者 陈珊珊 通讯员 韩桦)为让家长直观了解孩子在校饮食情况,近日,淄博市高青县三合小学举办食堂开放日活动
2025-11-05 11:09:00
本科直升| 韩国留学理性择业:聚焦潜力领域,实现学业与职业双赢
鲁网11月5日讯随着韩国留学日益受到中国学生和家长的关注,专业选择成为影响未来发展的重要一环。不少学生盲目追随热门专业
2025-11-05 11:09:00
小叶医探 | 七岁女童持续高热不退,原来是“它”在作怪!
大皖新闻讯 7岁女童持续高烧、全身皮疹,症状类似川崎病,在接受标准治疗后病情未见好转,是怎么回事?11月5日,“小叶医探”从国家儿童区域医疗中心
2025-11-05 11:37:00
鲁网11月5日讯(记者 杨勇 通讯员 姜林)近日,聊城市临清市市民荆先生将一面饱含感激之情的锦旗专程送至邮储银行聊城市分行下辖网点临清市石槽营业所工作人员手中
2025-11-05 11:41:00
泰安高新区京卫制药:破局创新药产业化“最后一公里”
鲁网11月5日讯药品从实验室里闪烁的创新火花,到药店货架上惠及千家万户,中间需要走多远的路?让创新种子在产业土壤中开花结果
2025-11-05 11:42:00
守护养老钱,反诈暖夕阳——泰山区徐家楼街道白峪店子村开展老年防诈骗宣传活动
鲁网11月5日讯为切实守护老年人财产安全,增强老年群体防诈骗意识和自我保护能力,11月4日,泰安市泰山区徐家楼街道白峪店子村新时代文明实践站联合街道司法所
2025-11-05 11:43:00
匠心酿就香油韵 乡情温暖乡野间
鲁网11月5日讯在泰安市宁阳县乡饮乡宁家庄村,宁桂森的石磨香油作坊,是村里最热闹的地方之一。每天清晨,石磨转动的“吱呀”声和芝麻的醇香
2025-11-05 11:44:00