本文作者:访客

斯坦福回应抄袭清华系大模型,斯坦福学生 AI 团队被指抄袭中国大模型成果,成员道歉后删文

访客 2024-06-04 14:07:23 42480 抢沙发

一支由斯坦福学生组成的AI团队近日被曝抄袭,涉嫌抄袭中国大规模模型成果。6月3日,该团队一名成员在社交媒体上道歉,但随后不久删除了博文。

5月29日,一个研究团队发布了名为“Llama3-V”的模型,声称仅需花费500美元(约合人民币3625元)就能训练出SOTA(State of the Art,最先进的)多模态大模型,与GPT4-V、Gemini Ultra、Claude Opus等模型相当,但模型体积小100倍。

公开资料显示,Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 均为斯坦福大学计算机系本科生,发表过多篇机器学习相关论文。凭借名校背景、特斯拉、SpaceX 等大公司从业经历,加上据称足以“改变现状”的研究成果,Llama3-V 受到了不小的关注。Llama3-V 不仅在社交媒体上迅速走红,还一度登上 HuggingFace 趋势榜(机器学习领域比较有影响力的平台,其趋势榜单一定程度上反映了模型的受欢迎程度)首页。

但很快,关于Llama3-V的质疑声就出现了,有网友爆料Llama3-V是国内大型模型创业公司“棉比智能”与清华大学自然语言处理实验室联合推出的MiniCPM-Llama3-V 2.5的壳,并在棉比智能GitHub项目下发布证据。

这些证据包括:Llama3-V的模型架构和代码与MiniCPM-Llama3-V 2.5几乎完全相同,仅在变量名和格式上存在一些差异;Llama3-V使用了MiniCPM-Llama3-V 2.5的tokenizer,MiniCPM-Llama3-V 2.5中定义的特殊符号在Llama3-V中也出现;通过将从HuggingFace下载的Llama3-V模型权重中的变量名更改为MiniCPM-Llama3-V 2.5的变量名,可以使用MiniCPM-V代码成功运行模型。

斯坦福回应抄袭清华系大模型

两种模型的代码比较

该网友为何不直接质疑Llama3-V,而是将其曝光在面比智能GitHub项目下?其实该网友此前曾在6月2日的Llama3-V页面上提出过质疑,但很快就被Llama3-V的作者删除了。

而接到提醒之后,MiniCPM-Llama3-V 2.5团队也迅速作出了反应,并有了新的证据:Llama3-V型号居然能识别《清华竹简》。

公开资料显示,清华竹简是清华大学于2008年7月收藏的一批战国竹简,属于战国中晚期的文物。MiniCPM-Llama3-V 2.5团队透露,识别清华竹简是MiniCPM-Llama3-V 2.5的一项实验功能,训练图像是MiniCPM-Llama3-V 2.5团队近期从出土文物中扫描并标注出来的,尚未公开发布。

两个模型在识别性能上正确结果基本相同,错误情况也比较相似。

识别结果对比

针对上述结果,MiniCPM-Llama3-V 2.5团队表示,很难用巧合来解释这种不寻常的相似性,并希望Llama3-V的作者能够就此问题给出官方解释。我们相信这对于开源社区的共同利益至关重要。

经质疑后,Llama3-V的GitHub项目主页目前显示“404”,HuggingFace上的Llama3-V项目也已不复存在,在作者的社交媒体账号上也找不到任何宣传Llama3-V的内容。

6月3日,Llama3-V团队成员Aksh Garg在社交媒体上回应了这些质疑,但该回应随后不久被删除。

网友截图。目前该动态已无法查看。

据媒体报道,眠比智能CEO李大海也对此作出了回应。他表示,“技术创新并不容易,每一项工作都是团队日夜努力的结果,也是对有限算力下世界技术进步和创新发展的真诚贡献。我们希望团队的好作品能够得到更多人的关注和认可,但不是以这种方式。我们对此事深感遗憾!一方面我们觉得这也是一种得到国际团队认可的方式,另一方面也呼吁大家共建开放、合作、信任的社区环境,让我们一起努力,让世界随着AGI的到来而变得更美好!”

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,42480人围观)参与讨论

还没有评论,来说两句吧...