8 月 2 日消息,荷蘭內(nèi)梅亨大學(xué)近日發(fā)布研究報(bào)告,指出 Meta 和 OpenAI 等公司在使用“開(kāi)源”術(shù)語(yǔ)時(shí)容易誤導(dǎo)用戶,部分標(biāo)記為“開(kāi)源”的大語(yǔ)言模型實(shí)際上并非開(kāi)源的。
該報(bào)告特別提及了 Meta 公司的 Llama 2 模型和 OpenAI 的 GPT / codex 模型,表示訓(xùn)練這些大語(yǔ)言模型的代碼并未向公眾開(kāi)放。
研究人員表示,當(dāng)前 AI 社區(qū)中,缺乏開(kāi)源大語(yǔ)言模型問(wèn)題日益突顯。研究人員呼吁公司發(fā)布更多的開(kāi)源 LLM,以便研究人員和開(kāi)發(fā)人員可以訪問(wèn)代碼并提高這些模型的性能。
OpenAI 的 ChatGPT 模型是最“神秘”的,不符合開(kāi)源標(biāo)準(zhǔn);而 Meta 的 Llama 2 雖然宣稱(chēng)是“開(kāi)源”,但實(shí)際透明度只是稍微優(yōu)于 ChatGPT 模型,在開(kāi)源排行榜上的程度依然很低。
研究報(bào)告認(rèn)為這些公司主要出于以下幾點(diǎn)原因:
想要保護(hù)自己的知識(shí)產(chǎn)權(quán)
想要控制如何使用大語(yǔ)言模型
而研究人員和開(kāi)發(fā)人員在面臨開(kāi)源大語(yǔ)言模型上存在天然的弱勢(shì),可能無(wú)法研究論文結(jié)果、改進(jìn)現(xiàn)有大語(yǔ)言模型的性能。
Meta 的立場(chǎng)是諷刺的,因?yàn)樵摴咀院赖卣f(shuō),Llama 2 可用于研究。即便如此,該公司似乎仍將該項(xiàng)目的某些部分鎖定在開(kāi)發(fā)人員和研究人員之外。