零一万物回应Yi大模型涉嫌抄袭LLaMA事件_资讯

零一万物回应Yi大模型涉嫌抄袭LLaMA事件

中关村在线

2023-11-16 00:24:01

2023-11-15 17:44:15 作者：姚立伟

11月15日，AI大模型创业公司“零一万物”公开回应了其Yi大模型涉嫌抄袭LLaMA事件。该公司表示，确实存在做法不妥之处，并将会按照外界建议修改争议张量（Tensor）名称。

零一万物由创新工场董事长兼CEO李开复于今年创办，并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型。这些模型号称对学术研究完全开放，同步开放免费商用申请。

然而，在不久前，开发者ehartford在Yi-34B的Hugging Face开源主页上指出，该模型使用了Meta LLaMA的架构，只对两个张量名称进行了修改：input_layernorm和post_attention_layernorm。

ehartford呼吁该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构，并将这一更改应用到官方模型中。

零一万物开源团队总监Richard Lin昨天承认，修改Llama张量名的做法不妥当，并表示将会按照外界建议把“修改后的张量名称从Yi改回LLaMA”。 Richard Lin解释称，这一问题主要源于开发人员疏忽导致。为了满足测试要求，他们在代码中进行了几次重命名操作，但之后忘记了将张量名称重新改为LLaMA。

然而，另一名开发者JosephusCheung则认为既然官方已经宣布修改Yi大模型张量名称，那么Yi便是LLaMA的衍生作品。他指出，“因为其推理部分和模型定义都是‘LLaMA’的一部分。”

目前，Richard Lin尚未对此事进行回复。

上一篇：美团、去哪儿等旅行、社交多领域应用陆续加入华为鸿蒙原生应用开发

下一篇：数字孪生技术助力库区智慧管理

零一万物回应Yi大模型涉嫌抄袭LLaMA事件

相关内容

热门资讯