斯坦福回应抄袭清华系大模型，斯坦福学生 AI 团队被指抄袭中国大模型成果，成员道歉后删文

访客 2024-06-04 14:07:23 42480 抢沙发

默认

一支由斯坦福学生组成的AI团队近日被曝抄袭，涉嫌抄袭中国大规模模型成果。6月3日，该团队一名成员在社交媒体上道歉，但随后不久删除了博文。

5月29日，一个研究团队发布了名为“Llama3-V”的模型，声称仅需花费500美元（约合人民币3625元）就能训练出SOTA（State of the Art，最先进的）多模态大模型，与GPT4-V、Gemini Ultra、Claude Opus等模型相当，但模型体积小100倍。

公开资料显示，Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 均为斯坦福大学计算机系本科生，发表过多篇机器学习相关论文。凭借名校背景、特斯拉、SpaceX 等大公司从业经历，加上据称足以“改变现状”的研究成果，Llama3-V 受到了不小的关注。Llama3-V 不仅在社交媒体上迅速走红，还一度登上 HuggingFace 趋势榜（机器学习领域比较有影响力的平台，其趋势榜单一定程度上反映了模型的受欢迎程度）首页。

但很快，关于Llama3-V的质疑声就出现了，有网友爆料Llama3-V是国内大型模型创业公司“棉比智能”与清华大学自然语言处理实验室联合推出的MiniCPM-Llama3-V 2.5的壳，并在棉比智能GitHub项目下发布证据。

这些证据包括：Llama3-V的模型架构和代码与MiniCPM-Llama3-V 2.5几乎完全相同，仅在变量名和格式上存在一些差异；Llama3-V使用了MiniCPM-Llama3-V 2.5的tokenizer，MiniCPM-Llama3-V 2.5中定义的特殊符号在Llama3-V中也出现；通过将从HuggingFace下载的Llama3-V模型权重中的变量名更改为MiniCPM-Llama3-V 2.5的变量名，可以使用MiniCPM-V代码成功运行模型。

两种模型的代码比较

该网友为何不直接质疑Llama3-V，而是将其曝光在面比智能GitHub项目下？其实该网友此前曾在6月2日的Llama3-V页面上提出过质疑，但很快就被Llama3-V的作者删除了。

而接到提醒之后，MiniCPM-Llama3-V 2.5团队也迅速作出了反应，并有了新的证据：Llama3-V型号居然能识别《清华竹简》。

公开资料显示，清华竹简是清华大学于2008年7月收藏的一批战国竹简，属于战国中晚期的文物。MiniCPM-Llama3-V 2.5团队透露，识别清华竹简是MiniCPM-Llama3-V 2.5的一项实验功能，训练图像是MiniCPM-Llama3-V 2.5团队近期从出土文物中扫描并标注出来的，尚未公开发布。

两个模型在识别性能上正确结果基本相同，错误情况也比较相似。

识别结果对比

针对上述结果，MiniCPM-Llama3-V 2.5团队表示，很难用巧合来解释这种不寻常的相似性，并希望Llama3-V的作者能够就此问题给出官方解释。我们相信这对于开源社区的共同利益至关重要。

经质疑后，Llama3-V的GitHub项目主页目前显示“404”，HuggingFace上的Llama3-V项目也已不复存在，在作者的社交媒体账号上也找不到任何宣传Llama3-V的内容。

6月3日，Llama3-V团队成员Aksh Garg在社交媒体上回应了这些质疑，但该回应随后不久被删除。

网友截图。目前该动态已无法查看。

据媒体报道，眠比智能CEO李大海也对此作出了回应。他表示，“技术创新并不容易，每一项工作都是团队日夜努力的结果，也是对有限算力下世界技术进步和创新发展的真诚贡献。我们希望团队的好作品能够得到更多人的关注和认可，但不是以这种方式。我们对此事深感遗憾！一方面我们觉得这也是一种得到国际团队认可的方式，另一方面也呼吁大家共建开放、合作、信任的社区环境，让我们一起努力，让世界随着AGI的到来而变得更美好！”

标签：模型团队