编辑:[db:作者] 时间:2024-08-25 04:07:16
在路人的质疑下,斯坦福AI团队删除质疑帖并隐蔽了Llama3-V项目页面。
抄得“连做错样例都千篇一律”
5月29日,一个来自斯坦福的AI团队开始在网络上宣扬500美元就能演习出一个SOTA多模态模型,该模型名为Llama3-V,作者声称Llama3-V比GPT-4V、Gemini Ultra、Claude Opus性能更强。公开资料显示,团队内有两位成员为斯坦福大学本科生,曾揭橥多篇机器学习领域论文,演习经历包括亚马逊云平台AWS和特斯拉SpaceX等。
如此亮眼的演习经历加上斯坦福大学的背书,很快引起了网友的围不雅观。不料,有技能圈人士发起了质疑。该人士称,名为Llama3-V的模型有大量作品疑似从MiniCPM-Llama3-V 2.5项目中盗取而来,后者为海内大模型初创企业面壁智能推出的开源端侧多模态模型,于2024年5月21日刚发布。
在路人的质疑下,斯坦福AI团队删除质疑帖并隐蔽了Llama3-V项目页面。这引起了该质疑人士的愤怒,进一步举证证明抄袭。南都梳理发现,质疑人士认为,Llama3-V具有与面壁智能开源大模型完备相同的模型构造和配置文件,仅在变量名称上有所不同;其次Llama3-V作者害怕面对质疑,删除了质疑评论,还隐蔽了与Llama3-V干系的项目页面。
随后,面壁智能员工亲自了局,将面壁智能模型MiniCPM-Llama3-V 2.5的识别“清华简”功能与Llama3-V类似功能相对照。据悉,“清华简”是一种罕见写在竹子上的战国时期笔墨,在研发实验该功能的过程中,面壁智能团队重新近出土的文物中扫描了这些图片,并在大模型中进行原始注释。不料当该员工用Llama3-V识别“清华简”时,Llama3-V给出了近似的识别反应。
面对这次抄袭事宜,面壁智能CEO李大海发文表示,来自斯坦福团队的Llama3V项目与面壁小钢炮最新发布的多模态模型MiniCPM-Llama3-V 2.5展现出惊人的相似度。
“经由团队核实,除了社区网友列出的证据外,我们还创造Llama3V展现出和小钢炮一样的清华简识别能力,连做错的样例都千篇一律,而这一演习数据尚未对外公开。这项事情是团队同学耗时数个月,从卷帙浩繁的清华简中一个字一个字扫描下来,并逐一进行数据标注,领悟进模型中的。更加tricky的是,两个模型在高斯扰动验证后,在精确和缺点表现方面都高度相似。我们对这件事深表遗憾,一方面感慨这也是一种受到国际团队认可的办法,另一方面也呼吁大家共建开放、互助、有信赖的社区环境。一起加油互助,让天下因AGI的到来变得更好!”
面壁智能核心团队来自清华NLP实验室、知乎
这次被牵扯进抄袭风波中的面壁智能创立于2022年8月,团队的核心成员来自清华大学自然措辞处理与社会人文打算实验室 (THUNLP)——该实验室也撑起了去年大模型创业浪潮以来的“半壁江山”,跑出了生数科技、深言科技等人工智能企业和华为的“盘古大模型”。
今年4月,南都从面壁智能方面获悉,该公司已完成了新一轮数亿元融资,该轮次融资由春华创投、华为哈勃领投,北京市人工智能家当投资基金等跟投,而知乎作为计策股东持续跟投支持。据悉,该轮融资将用于人才引入、大模型底层算力与数据根本的建构以及推动大模型高效演习和运用落地。
在放眼望去清一色的清华系实验室创始团队中,面壁智能的CEO李大海是个中最分外的存在,这不仅由于他兼任着知乎的CTO(首席技能官),也由于他在去年的大模型浪潮中一番探索后,选择了面壁智能来开启他人生中的第四次创业,这也是他第一次担当创业团队的一号位。
在加入知乎前,2006年大学毕业后,李大海还有加入Google成为Google中国创始员工之一,与时任Google北京工程副院长刘俊一起做出了海内第一个社会化搜索引擎“如斯网”,以及加入豌豆荚卖力搜索业务等亮眼创业经历。
2023年,随着ChatGPT浪潮席卷科技圈,时任知乎CTO的李大海在深入调研后知乎决定与面壁智能互助。4月,知乎宣告对面壁智能进行了数千万公民币的天使轮投资,同为清华系的头部大模型企业智谱参与跟投。后续,面壁智能陆续发布了共研的知乎大模型“知海图AI”、基于大模型的对话产品“面壁Luca”等。此前,面壁智能的基座模型产品“面壁露卡Luca”已获备案审批并对外开放。
而在一年后的这一次融资中,除了知乎作为计策股东持续跟投支持以外,投资者中还多了春华创投、华为哈勃,以及北京市人工智能家当投资基金。个中北京市人工智能家当投资基金刚于今年年初投资了智谱AI。
据媒体宣布,面壁智能联合创始人刘知远对此事评论称,人工智能的飞速发展离不开环球算法、数据与模型的开源共享,让人们始终可以站在SOTA的肩上持续提高。但开源共享的基石是对开源协议的遵守,对其他贡献者的信赖,对古人成果的尊重和致敬,Llama3-V团队无疑严重毁坏了这一点。
刘知远还提到,海内大模型团队如智谱-清华GLM、阿里Qwen、DeepSeek和面壁-清华OpenBMB正在通过持续的开源共享,在国际上受到了广泛的关注和认可。
采写:南都 林文琪
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/xyj/113080.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com