斯坦福抄袭中国AI大模型，内藏清华简彩蛋露馅，急道歉、删除（组图）

2024-06-06 来源：世界新闻网原文链接评论4条

美国史丹福（斯坦福）大学一AI团队发布了名为Llama3-V的多模态大模型，但随后，该团队发布的模型因为一个暗藏的「清华简」彩蛋，被发现其模型抄袭自中国大模型。目前，该团队已公开道歉，并删除了相关库和官宣推文。

斯坦福抄袭中国AI大模型，内藏清华简彩蛋露馅，急道歉、删除（组图） - 1 美国史丹福一AI团队发布了名为Llama3-V的多模态大模型，却被指出抄袭中大模型；示意图。（路透）

每日经济新闻报导，史丹福大学AI团队在2024年5月29日发布了一个名为Llama3-V的多模态大模型，声称只需500美元(约3619元人民币)就能训练出一个性能可与GPT4-V媲美的模型。Llama3-V不仅在社交媒体上迅速窜红，还一度冲上了HuggingFace趋势榜首页。

然而，一名细心网友发现，该团队发布的Llama3-V和中国国内大模型MiniCPM-Llama3-V 2.5有极高的相似度，后者是由中国大模型初创企业「面壁智能」和清华大学自然语言处理实验室联合推出的。该网友表示，这两个模型的结构、代码、配置文件都一模一样，只有变量名被替换了。

面壁智能首席科学家、清华大学长聘副教授刘知远随后在知乎上回应，MiniCPM-Llama3-V 2.5在研发时内置了一个彩蛋，就是对「清华简」的识别能力，而Llama3-V模型居然也有一模一样的能力。

清华简是清华大学于2008年7月收藏的一批战国竹简，为战国中晚期文物。刘知远透露，识别清华简是MiniCPM-Llama3-V 2.5的一项实验功能，训练图像是最近从出土文物中扫描并标注，且尚未公开发布。

报导指出，遭到大量质疑后，该史丹福团队成员已删除他们在X平台上官宣模型的推文，并将该项目在Github和HuggingFace上的相关库一并删除。

Llama3-V团队的森德哈斯·沙玛（Siddharth Sharma）和阿克沙·加格（Aksh Garg）4日在社交平台上，就这一学术不端行为向面壁智能MiniCPM团队正式道歉，并表示会将Llama3-V模型悉数撤下。

阿克沙表示，为这个项目编写代码的穆斯塔法（Mustafa）已无法联系。他们查看了最新的论文，以验证这项工作的新颖性，但并未被告知或意识到OpenBMB（清华团队支持发起的大规模预训练语言模型库与相关工具）之前的任何工作。他们向作者道歉，并对自己没有努力验证这项工作的原创性感到失望。

面壁智能CEO李大海3日表达了对此事的深切遗憾，他指出，尽管从某种程度上看，这种模仿可以被视为他们的成果得到了国际团队的某种认可，但他更强调应该构建一个开放、协作且充满信任的技术社区环境。他们希望团队的努力和优秀工作能够吸引更多人的关注和认可，但并非以这种被模仿甚至抄袭的方式。

斯坦福抄袭中国AI大模型，内藏清华简彩蛋露馅，急道歉、删除（组图） - 2 中国大模型里的「清华简」可以辨识对比战国古文字。（取材自微博）

转载声明：本文为转载发布，仅代表原作者或原平台态度，不代表我方观点。今日澳洲仅提供信息发布平台，文章或有适当删改。对转载有异议和删稿要求的原著方，可联络[email protected]。

最新评论(4)

大渝要去普渡 2024-06-06

看来所谓的学术风气，也会因一点点不端行为瞬间崩塌啊。

怪雨幽云 2024-06-06

须提高警惕，防护好自己的成果

Timkong 2024-06-06

家贼难防

萌pinpin 2024-06-06

开源可以用，但是任何开源只要有人捣乱，还是后患无穷。

热评新闻