• 我的订阅
  • 财经

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联

类别:财经 发布时间:2024-06-04 22:12:00 来源:澎湃新闻

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联

美国斯坦福大学的一个AI(人工智能)团队就抄袭中国大模型致歉。

近日,由三位美国斯坦福大学学生组成的一个AI团队发布了开源模型Llama3-V。但是,该模型很快被曝出与中国大模型公司面壁智能的开源成果MiniCPM-Llama3-V 2.5拥有几乎完全相同的模型架构与代码,引发“抄袭”质疑。

当地时间6月3日,Llama3-V团队的两位作者森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)在社交平台X上发布文章,向MiniCPM团队正式道歉,表示会将Llama3-V模型从网络上撤下。

在道歉信中,沙玛和加格称他们负责模型的宣发工作,该模型代码的作者是穆斯塔法·阿尔贾德里(Mustafa Aljadery),但两人在看到相关质疑后于6月2日询问了阿尔贾德里,此后再也没能联系上后者,于是决定发布道歉声明。

目前,阿尔贾德里的X账号显示“仅好友可见”,Llama3-V模型也已经从Hugging Face等开源平台上下架。不过,加格还在发布Llama3-V的Medium页面上保留了一些描述和介绍,在开头附上了道歉声明。

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联

道歉声明。来源:X平台

公开资料显示,北京面壁智能科技有限责任公司成立于2022年8月,核心产品包括全流程大模型高效加速平台ModelForce和CPM大模型。今年4月,面壁智能完成新一轮数亿元融资,由华为哈勃领投,春华创投、北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。

在该团队道歉前,面壁智能的联合创始人兼CEO李大海已在朋友圈发文回应,披露了Llama3-V能够与MiniCPM一样识别出“清华简”战国古文字的新证据,而由MiniCPM团队扫描并人工批注的该古文字数据并未对外公开,证实了Llama3-V模型涉嫌抄袭。

李大海表示,团队对这件事深表遗憾:“我们希望团队的好工作被更多人关注与认可,但不是以这种方式……一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联

面壁智能CEO李大海的朋友圈回应

这场风波起源于5月29日。当日,斯坦福大学的一个研究团队在开源社区中发布了名为“Llama3-V”的模型,称只要500美元(约合人民币3622元)就能训练出一个SOTA多模态模型,且效果比肩知名大模型GPT-4V、Gemini Ultra与Claude Opus。

由于该团队的三位作者都来自斯坦福大学,又拥有在特斯拉、SpaceX和亚马逊等科技大厂的相关经历,发布该模型的X文章很快获得超过30万的浏览量,该模型也迅速在Hugging Face首页的模型热度名单上冲进前排。

然而,不久后,开源社区内开始出现怀疑声,质疑Llama3-V是在“套壳”面壁智能于今年5月中旬刚刚发布的最新8B多模态小模型MiniCPM-Llama3-V 2.5,且没有在项目中提到任何关于后者的信息。

对此,Llama3-V团队回应称其“只是使用了MiniCPM-Llama3-V 2.5的tokenizer(分词器)”,并称团队在MiniCPM-Llama3-V 2.5发布前就已经开始了这项工作。

6月2日,网友pzc163在MiniCPM-V的Github页面上对此事进行了还原,并列举出大量的代码证据。该网友称自己在Llama3-V的Github发布页面下提出了疑问,但Llama3-V团队迅速删帖并对Llama3-V模型进行隐藏处理,所以来提醒MiniCPM-V团队关注此事。

错例都一样!斯坦福学生团队致歉抄袭中国大模型:已撤回 代码作者失联

质疑Llama3-V项目的帖子。来源:Github

证据显示,Llama3-V项目使用了与MiniCPM-Llama3-V 2.5项目基本完全相同的模型结构和代码实现。另外,Hugging Face 发布页面上的历史记录显示,Llama3-V的作者曾在该页面上直接导入了MiniCPM-V的代码,然后改名为Llama3-V。

在该帖的回复中,网友们纷纷建议向斯坦福大学举报此事。有评论指出,虽然套用开源模型且没有致谢的做法可能只是造成了一些侵权,但由于Llama3-V的团队在网络上对该模型进行了大力宣传,或将在开源领域造成广泛的负面影响。

值得一提的是,在Llama3-V团队道歉前,斯坦福人工智能实验室主任克里斯托弗·大卫·曼宁(Christopher David Manning)也在X平台上发文谴责这一抄袭行为,并称MiniCPM“是很好的开源作品”。

对于此事,面壁智能首席科学家、清华大学长聘副教授刘知远也在知乎上发表了回应,称这次事件让他感慨“过去十几年科研经历的斗转星移”:“从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;同时,从纵向来看,我们已经从十几年的nobody,快速成长为人工智能科技创新的关键推动者。面向即将到来的AGI时代,我们应该更加自信积极地投身其中。”

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-04 23:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前
#斯坦福抄袭中国大模型##斯坦福团队道歉#,今天下午,两个词条分别冲上微博热搜第2和第5位,引发热议。斯坦福团队承认抄袭中国大模型冲上热搜简单说,就是国外一个AI团队主导的开源大
2024-06-05 11:04:00
硅谷手记|AI抄袭背后的硅谷“不光彩文化”
...“‘作假,直至成功’,这是硅谷不光彩的文化。”美国斯坦福大学人工智能实验室主任克里斯托弗·曼宁3日就该校某些研究人员抄袭中国清华大学等机构成果的行为这样评论说。他在社交媒体上
2024-06-05 13:55:00
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态
2024-06-04 14:35:00
马斯克:SpaceX星舰已准备好第四次试飞;字节跳动任命前华纳兄弟高管担任全球总法律顾问|AI daily早新闻
...4日讯今日AI daily早新闻主要内容有:面壁智能CEO发文回应斯坦福某AI团队“抄袭”:感到遗憾;Arm CEO
2024-06-04 09:56:00
车企老总下场做IP的时代,AI大模型能改变营销内卷吗?
最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训
2024-06-06 13:44:00
欧盟通过AI监管草案后,斯坦福研究显示:全球主流AI模型均不达标 | 最前线
...了广泛争议。如今,监管脚步正在快速迫近。6月中旬,斯坦福大学AI研究实验室发布了一项对AI大模型的研究的结果。研究以十个AI大模型为研究对象,评估他们是否达到欧盟AI法案的标
2023-06-27 16:37:00
斯坦福“草泥马”火了:100美元就能比肩gpt-3.5
一夜之间,大模型界又炸出个bignews!斯坦福发布 Alpaca(羊驼,网友口中的“草泥马”):只花100美元,人人都可微调Meta家70亿参数的LLaMA大模型
2023-03-15 22:40:00
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
空间智能版ImageNet来了,来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示
2024-11-11 13:31:00
斯坦福团队研发新型深度学习模型,能预测碳捕集引起的地表位移
近日,美国斯坦福大学团队利用深度学习中的计算机视觉技术,打造出一款新型深度学习模型。从地下地层结构图像出发,他们成功预测了二氧化碳捕集与封存技术(CCS
2024-04-08 10:16:00
更多关于财经的资讯: