Graphcore公布首次MLPerf提交結(jié)果:AI性能穩(wěn)居領(lǐng)先地位

【 TechWeb】7月1日消息,Graphcore(擬未科技)正式公布其參與的首次MLPerf提交結(jié)果,Graphcore產(chǎn)品表現(xiàn)優(yōu)異,AI性能穩(wěn)居領(lǐng)先地位。

MLPerf是AI行業(yè)最受認(rèn)可的比較基準(zhǔn)測試。此次測試結(jié)果顯示,在Graphcore IPU-POD64上,BERT的訓(xùn)練時間只有9分多鐘,ResNet-50的訓(xùn)練時間為14.5分鐘,AI性能已達(dá)超級計(jì)算機(jī)級別。

MLPerf還對比了市面上的Graphcore系統(tǒng)與NVIDIA的最新產(chǎn)品,結(jié)果證實(shí)Graphcore在“每美元性能”(Performance-Per-Dollar)指標(biāo)上穩(wěn)居領(lǐng)先地位。對客戶而言,這項(xiàng)重要的第三方測試確認(rèn)了Graphcore系統(tǒng)不僅具有新一代AI的優(yōu)異性能,同時在目前的廣泛應(yīng)用中也表現(xiàn)得更出色。

MLPerf基準(zhǔn)測試

對于第一次MLPerf(訓(xùn)練版本1.0)提交,Graphcore選擇聚焦在關(guān)鍵圖像分類和自然語言處理的應(yīng)用基準(zhǔn)測試類別。MLPerf圖像分類基準(zhǔn)使用流行的ResNet-50版本1.5模型,在ImageNet數(shù)據(jù)集上訓(xùn)練,以達(dá)到適用于所有提交情況的準(zhǔn)確率。對于自然語言處理,使用了BERT-Large模型和選取的一個代表性片段。該片段大約占總訓(xùn)練計(jì)算工作負(fù)載的10%,并使用維基百科數(shù)據(jù)集進(jìn)行訓(xùn)練。Graphcore決定提交使用ResNet-50和BERT的圖像分類和自然語言處理,在很大程度上是由客戶和潛在客戶驅(qū)動的,因?yàn)檫@是他們最常用的一些應(yīng)用和模型。此次在MLPerf測試中的強(qiáng)勁表現(xiàn),進(jìn)一步證明了Graphcore系統(tǒng)完全可以滿足當(dāng)今的AI計(jì)算要求。

參與測試的兩個Graphcore系統(tǒng),IPU-POD16和IPU-POD64,均已在生產(chǎn)中交付給客戶。

MLPerf測試包含開放分區(qū)和封閉分區(qū)兩個提交分區(qū)。封閉分區(qū)嚴(yán)格要求提交者使用完全相同的模型實(shí)施和優(yōu)化器方法,包括定義超參數(shù)狀態(tài)和訓(xùn)練時期。開放分區(qū)保證和封閉分區(qū)完全相同的模型準(zhǔn)確性和質(zhì)量,但支持更靈活的模型實(shí)施以促進(jìn)創(chuàng)新。因此,該分區(qū)支持更快的模型實(shí)現(xiàn),更加適應(yīng)不同的處理器功能和優(yōu)化器方法。對于像Graphcore IPU這樣的創(chuàng)新架構(gòu),開放分區(qū)更能體現(xiàn)出產(chǎn)品的優(yōu)異性能,但Graphcore還是選擇在開放和封閉分區(qū)都進(jìn)行了提交。

測試結(jié)果體現(xiàn)了Graphcore系統(tǒng)的優(yōu)異性能,即使在具有限制規(guī)格的開箱即用的封閉分區(qū)上也是如此。更令人矚目的是開放分區(qū)結(jié)果,Graphcore能夠在其中優(yōu)化部署,以充分利用IPU和系統(tǒng)功能。這更貼近真實(shí)應(yīng)用,支持客戶可以不斷提升其系統(tǒng)性能。

“每美元性能”指標(biāo)

MLPerf被稱為比較基準(zhǔn),實(shí)際上進(jìn)行直接比較可能很復(fù)雜。從相對簡單的硅片到有著昂貴存儲的復(fù)雜堆棧式芯片,如今的處理器和系統(tǒng)架構(gòu)可謂千差萬別。從“每美元性能”角度來看,往往最能夠說明問題。

Graphcore的IPU-POD16是一個5U的系統(tǒng),標(biāo)價149,995美元。如前所述,它由4個IPU-M2000加速器以及行業(yè)標(biāo)準(zhǔn)主機(jī)服務(wù)器構(gòu)成。每個IPU-M2000由4個IPU處理器構(gòu)成。MLPerf中使用的NVIDIA DGX-A100 640GB是一個6U機(jī)盒,標(biāo)價約為300,000美元(基于市場情報和公布的經(jīng)銷商定價),有8個DGX A100芯片。IPU-POD16的價格是它的一半。在這個系統(tǒng)中,IPU-M2000的價格和一個DGX A100 80GB的價格是一樣的,或者在更細(xì)的層次上,一個IPU的價格是它的四分之一。

在MLPerf比較分析中,Graphcore采用了嚴(yán)格監(jiān)管的封閉分區(qū)的結(jié)果,并針對系統(tǒng)價格對其進(jìn)行了歸一化。對于ResNet-50和BERT,很明顯Graphcore系統(tǒng)提供了比NVIDIA產(chǎn)品更好的每美元性能。在IPU-POD16上進(jìn)行ResNet-50訓(xùn)練的情況下,Graphcore的每美元性能是NVIDIA的1.6倍。在BERT上,Graphcore的每美元性能是NVIDIA的1.3倍。Graphcore系統(tǒng)的經(jīng)濟(jì)性可以更好地幫助客戶實(shí)現(xiàn)其AI計(jì)算目標(biāo),同時,由于IPU專為AI構(gòu)建的架構(gòu)特點(diǎn),Graphcore系統(tǒng)還可以解鎖下一代模型和技術(shù)。

Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤表示:“首次提交MLPerf就獲得如此出色的成績,我們感到非常自豪。此次測試還會帶給Graphcore客戶更多價值,因?yàn)槲覀冊跍?zhǔn)備階段所做的所有改進(jìn)和優(yōu)化都會反饋到Graphcore軟件棧中。全球范圍內(nèi)的Graphcore用戶都會從MLPerf測試中受益匪淺,不僅局限于BERT和ResNet-50模型。我們將繼續(xù)參與包括訓(xùn)練和推理在內(nèi)的MLPerf測試,為追求更優(yōu)性能、更大規(guī)模和添加更多模型,貢獻(xiàn)Graphcore的所有智慧和力量。”

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2021-07-01
Graphcore公布首次MLPerf提交結(jié)果:AI性能穩(wěn)居領(lǐng)先地位
【 TechWeb】7月1日消息,Graphcore(擬未科技)正式公布其參與的首次MLPerf提交結(jié)果,Graphcore產(chǎn)品表現(xiàn)優(yōu)異,AI性能穩(wěn)居領(lǐng)先地位。MLPer...

長按掃碼 閱讀全文