5000億參數(shù)!傳微軟準備推出自研大模型

5月7日消息,美國時間周一,有報道稱微軟正在訓(xùn)練名為MAI-1的內(nèi)部人工智能語言模型,其規(guī)??膳c谷歌和OpenAI的大模型相媲美。

根據(jù)兩名微軟員工的說法,MAI-1模型由最近微軟挖來的谷歌DeepMind聯(lián)合創(chuàng)始人、人工智能初創(chuàng)公司Inflection前首席執(zhí)行官穆斯塔法·蘇萊曼(Mustafa Suleyman)負責。

據(jù)悉,微軟還未明確MAI-1模型的確切用途,具體取決于模型效果如何。報道稱,微軟可能會在本月晚些時候召開的Build開發(fā)者大會上預(yù)覽這款新模型。

微軟對此拒絕發(fā)表評論。

據(jù)報道,MAI-1規(guī)模將比微軟之前訓(xùn)練的小型開源模型“大得多”,這意味著其也會更加昂貴。

上個月微軟推出了一款名為Phi-3-mini的小型人工智能模型,希望用有成本效益的產(chǎn)品吸引更多客戶群體。

微軟向OpenAI投資了上百億美元,并在旗下生產(chǎn)力軟件中部署OpenAI的人工智能技術(shù),從而在生成式人工智能領(lǐng)域的早期競賽中取得了領(lǐng)先地位。

據(jù)報道,為了提升該模型,微軟已經(jīng)配置了裝備了英偉達GPU的大型服務(wù)器集群,并儲備了大量數(shù)據(jù)。

報道稱,MAI-1將有大約5000億個參數(shù)。相比之下,OpenAI的GPT-4據(jù)稱有1萬億個參數(shù),Phi-3 mini有38億個參數(shù)。

今年3月份,微軟任命蘇萊曼為新成立的消費級人工智能部門負責人,同時還聘用了Inflection的幾名員工。

報道補充說,新模型并不是源自Inflection,但可能用到了這家創(chuàng)業(yè)公司的訓(xùn)練數(shù)據(jù)。(辰辰)

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2024-05-07
5000億參數(shù)!傳微軟準備推出自研大模型
5月7日消息,美國時間周一,有報道稱微軟正在訓(xùn)練名為MAI-1的內(nèi)部人工智能語言模型,其規(guī)??膳c谷歌和OpenAI的大模型相媲美。根據(jù)兩名微軟員工的說法,MAI-1模型由最近微軟挖來的谷歌DeepMind聯(lián)合創(chuàng)始人、人工智能初創(chuàng)公司Inflection前首席執(zhí)行官穆斯塔法·蘇萊曼(Mustafa Suleyman)...

長按掃碼 閱讀全文