2023-11-15 17:44:15 作者:姚立伟
11月15日,AI大模型创业公司“零一万物”公开回应了其Yi大模型涉嫌抄袭LLaMA事件。该公司表示,确实存在做法不妥之处,并将会按照外界建议修改争议张量(Tensor)名称。
零一万物由创新工场董事长兼CEO李开复于今年创办,并在本月初宣布推出Yi-34B和Yi-6B两个开源大模型。这些模型号称对学术研究完全开放,同步开放免费商用申请。
然而,在不久前,开发者ehartford在Yi-34B的Hugging Face开源主页上指出,该模型使用了Meta LLaMA的架构,只对两个张量名称进行了修改:input_layernorm和post_attention_layernorm。
ehartford呼吁该公司在模型被大量使用之前考虑重命名张量以符合LLaMA架构,并将这一更改应用到官方模型中。
零一万物开源团队总监Richard Lin昨天承认,修改Llama张量名的做法不妥当,并表示将会按照外界建议把“修改后的张量名称从Yi改回LLaMA”。 Richard Lin解释称,这一问题主要源于开发人员疏忽导致。为了满足测试要求,他们在代码中进行了几次重命名操作,但之后忘记了将张量名称重新改为LLaMA。
然而,另一名开发者JosephusCheung则认为既然官方已经宣布修改Yi大模型张量名称,那么Yi便是LLaMA的衍生作品。他指出,“因为其推理部分和模型定义都是‘LLaMA’的一部分。”
目前,Richard Lin尚未对此事进行回复。