火山引擎發(fā)布大模型訓(xùn)練云平臺:支持萬卡訓(xùn)練 集群性能提升3倍

4月18日消息,自2022年底發(fā)布以來,ChatGPT成為人類歷史上最快獲得上億用戶的消費(fèi)級互聯(lián)網(wǎng)應(yīng)用。最新的GPT-4大模型,更是在法律、數(shù)學(xué)、生物學(xué)等多項測試中超過90%人類。

今日,火山引擎發(fā)布自研DPU等系列云產(chǎn)品,并推出新版機(jī)器學(xué)習(xí)平臺支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò),讓大模型訓(xùn)練更穩(wěn)更快。

火山引擎總裁譚待表示,國內(nèi)很多科技公司投入到大模型建設(shè)中,他們有優(yōu)秀的技術(shù)團(tuán)隊,也有豐富的行業(yè)知識和創(chuàng)新想法,但往往缺乏經(jīng)過大規(guī)模場景實踐的系統(tǒng)工程能力。火山引擎要做的就是為大模型客戶提供高穩(wěn)定性和高性價比的AI基礎(chǔ)設(shè)施。

譚待認(rèn)為,大模型不會一家獨(dú)大。與其他云廠商力推自家大模型不同的是,火山引擎將接入多家大模型深度合作,為企業(yè)和消費(fèi)者提供更豐富的AI應(yīng)用。

據(jù)介紹,火山引擎機(jī)器學(xué)習(xí)平臺經(jīng)過抖音等海量用戶業(yè)務(wù)長期打磨,支持單任務(wù)萬卡級別的超大規(guī)模分布式并行訓(xùn)練場景。GPU彈性計算實例可靈活調(diào)度資源,隨用隨取,最高可以為客戶節(jié)省70%的算力成本。

字節(jié)跳動副總裁楊震原認(rèn)為,業(yè)務(wù)創(chuàng)新需要試錯,試錯要大膽、敏捷,但試錯也一定要控制成本。通過潮汐、混部等方式,火山引擎實現(xiàn)資源的高利用率和極低成本。以抖音推薦系統(tǒng)為例,工程師用15個月的樣本訓(xùn)練某個模型,5小時就能完成訓(xùn)練,成本只有5000元?;鸨W(wǎng)的抖音“AI繪畫”特效,從啟動到上線只用一周多時間,模型由一名算法工程師完成訓(xùn)練。

MiniMax是目前國內(nèi)少數(shù)已經(jīng)推出自研大模型產(chǎn)品的AI技術(shù)公司,擁有文本、視覺、聲音三種通用大模型引擎能力。據(jù)MiniMax聯(lián)合創(chuàng)始人楊斌介紹,MiniMax與火山引擎合作建立了超大規(guī)模實驗平臺,實現(xiàn)千卡級常態(tài)化訓(xùn)練;超大規(guī)模推理平臺有萬卡級算力池,支撐單日過億次調(diào)用。

譚待透露,火山引擎的大模型云平臺獲得智譜AI、昆侖萬維等眾多企業(yè)的良好反饋。國內(nèi)大模型領(lǐng)域,七成以上已是火山引擎客戶。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-04-18
火山引擎發(fā)布大模型訓(xùn)練云平臺:支持萬卡訓(xùn)練 集群性能提升3倍
火山引擎發(fā)布自研DPU等系列云產(chǎn)品,并推出新版機(jī)器學(xué)習(xí)平臺:支持萬卡級大模型訓(xùn)練、微秒級延遲網(wǎng)絡(luò)。

長按掃碼 閱讀全文