李開(kāi)復(fù)回應(yīng)大模型套殼LLaMA:受益于開(kāi)源也貢獻(xiàn)開(kāi)源

11月16日消息,針對(duì)近日零一萬(wàn)物被質(zhì)疑完全使用 LLaMA 架構(gòu),只對(duì)兩個(gè)張量(Tensor)名稱做修改,李開(kāi)復(fù)在朋友圈進(jìn)行了回應(yīng)。

IT之家報(bào)道,李開(kāi)復(fù)表示:“全球大模型架構(gòu)一路從 GPT2 --> Gopher --> Chinchilla --> Llama2 --> Yi,行業(yè)逐漸形成大模型的通用標(biāo)準(zhǔn),就像做一個(gè)手機(jī) App 開(kāi)發(fā)者,不會(huì)去自創(chuàng) iOS、Android 以外的全新基礎(chǔ)架構(gòu)。01.AI 起步受益于開(kāi)源,也貢獻(xiàn)開(kāi)源,從社區(qū)中虛心學(xué)習(xí),我們會(huì)持續(xù)進(jìn)步?!?/p>

創(chuàng)新工場(chǎng)董事長(zhǎng)兼 CEO 李開(kāi)復(fù)于 2023 年創(chuàng)辦了 AI 大模型創(chuàng)業(yè)公司“零一萬(wàn)物”,該公司已推出 Yi-34B 和 Yi-6B 兩個(gè)開(kāi)源大模型,號(hào)稱對(duì)學(xué)術(shù)研究完全開(kāi)放,同步開(kāi)放免費(fèi)商用申請(qǐng)。

然而在 Yi-34B 的 Hugging Face 開(kāi)源主頁(yè)上,開(kāi)發(fā)者 ehartford 質(zhì)疑稱該模型使用了 Meta LLaMA 的架構(gòu),只對(duì)兩個(gè)張量(Tensor)名稱進(jìn)行了修改,分別為 input_layernorm 和 post_attention_layernorm。

零一萬(wàn)物開(kāi)源團(tuán)隊(duì)總監(jiān) Richard Lin 回應(yīng)稱,這一命名問(wèn)題是開(kāi)發(fā)人員疏忽導(dǎo)致,開(kāi)發(fā)人員在代碼中進(jìn)行了幾次重命名,以滿足實(shí)驗(yàn)要求。但是開(kāi)發(fā)人員“忘記將張量名稱修改回 LLaMA”,開(kāi)發(fā)人員對(duì)此感到抱歉。

值得一提的是,原阿里首席 AI 科學(xué)家賈揚(yáng)清吐槽國(guó)內(nèi)某一新模型中用的其實(shí)是 LLaMA 架構(gòu),僅在代碼中更改了幾個(gè)變量名引發(fā)網(wǎng)絡(luò)熱議。在被指大模型回應(yīng)并發(fā)布訓(xùn)練模型過(guò)程后,賈揚(yáng)清最新發(fā)文,表示開(kāi)源領(lǐng)域“魔改”要不得。

15日,零一萬(wàn)物官方對(duì) Yi-34B 訓(xùn)練過(guò)程進(jìn)行了說(shuō)明,表示大模型持續(xù)發(fā)展與尋求突破口的核心點(diǎn)不僅在于架構(gòu),而是在于訓(xùn)練得到的參數(shù)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2023-11-16
李開(kāi)復(fù)回應(yīng)大模型套殼LLaMA:受益于開(kāi)源也貢獻(xiàn)開(kāi)源
早說(shuō)嘛。

長(zhǎng)按掃碼 閱讀全文