AI將數(shù)據(jù)中心架構(gòu)再次拖向分裂?

自從Alpha GO戰(zhàn)勝人類圍棋選手以來,AI就成為了整個(gè)商業(yè)社會(huì)中熱度最高的一個(gè)名詞。在AI的背后是對(duì)傳統(tǒng)商業(yè)模式的巨大顛覆和對(duì)社會(huì)生產(chǎn)力的空前解放。雖然AI很可能在未來淘汰掉一部分重復(fù)性勞動(dòng)很高的工作崗位,但因此所釋放出的勞動(dòng)力將在未來把人類的創(chuàng)造力推向新的高峰。

但除了已經(jīng)淪為陳詞濫調(diào)的AI光明未來,在實(shí)際的應(yīng)用中,AI技術(shù)卻仍舊處于萌芽狀態(tài)。在目前的階段,人工智能——Artificial Intelligence仍舊處于相當(dāng)初級(jí)的階段,還只能根據(jù)海量數(shù)據(jù)所構(gòu)建出的模型來完成應(yīng)用中的推理與判斷,離真正的自主型人工智能或根據(jù)有限信息來自主拓展模型并作出判斷的強(qiáng)人工智能還有很大的差距。

不過由于目前AI開發(fā)與應(yīng)用的主要模式已經(jīng)確認(rèn),對(duì)應(yīng)的研究手段也就變得明確起來。在現(xiàn)有的技術(shù)方向下,企業(yè)需要利用神經(jīng)網(wǎng)絡(luò)技術(shù)并使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)算法來構(gòu)建模型,在根據(jù)模型來開發(fā)對(duì)應(yīng)的軟硬件解決方案。而無論是訓(xùn)練AI模型還是利用AI模型來進(jìn)行推理判斷,強(qiáng)大的運(yùn)算能力都是必不可少的。

AI兩端的不同景象

在模型訓(xùn)練方面,由于輸入的數(shù)據(jù)類型和使用的DL/ML框架不同,硬件不僅需要有強(qiáng)大的并行計(jì)算和浮點(diǎn)能力,更要具備強(qiáng)大的靈活性。但這兩種需求都不是傳統(tǒng)x86服務(wù)器所擅長(zhǎng)的,因此就需要與x86異構(gòu)的協(xié)處理器來完成對(duì)應(yīng)的模型訓(xùn)練任務(wù)。在這一領(lǐng)域,最大的贏家無疑就是NVIDIA。面對(duì)這一市場(chǎng)的巨大需求和豐厚利潤(rùn),NVIDIA不僅推出了針對(duì)不同性能和應(yīng)用環(huán)境的多款GPU產(chǎn)品,更推出了對(duì)應(yīng)的一體機(jī)甚至是為大規(guī)模GPU互聯(lián)提供更高帶寬的NVLink總線。此外,針對(duì)云數(shù)據(jù)中心的虛擬化環(huán)境和相關(guān)訓(xùn)練程序的開發(fā),NVIDIA也有專門的GRID虛擬化技術(shù)及提高并行運(yùn)算效率的CUDA語言。

以龐大的產(chǎn)品研發(fā)投入,NVIDIA幾乎占領(lǐng)了AI中的模型訓(xùn)練市場(chǎng)。不過在利用成品模型進(jìn)行實(shí)際問題的推理判斷領(lǐng)域,NVIDIA卻還沒有獲得相應(yīng)的統(tǒng)治地位。

利用AI模型(程序)進(jìn)行實(shí)際問題的推理和判斷仍舊需要對(duì)應(yīng)的硬件系統(tǒng)擁有強(qiáng)大的運(yùn)算能力。但與模型訓(xùn)練的復(fù)雜場(chǎng)景不同,由于需要運(yùn)行的程序和處理的數(shù)據(jù)類型的相對(duì)固定,硬件系統(tǒng)并不需要很高的靈活性。相反,在實(shí)際的AI應(yīng)用場(chǎng)景中,用戶往往對(duì)硬件的采購成本、能效和部署效率有著更高的要求。

于是,專門對(duì)應(yīng)某種算法的AI芯片被越來越多的制造了出來。最近在資本圈和市場(chǎng)上引起廣泛關(guān)注的華為海思、寒武紀(jì)、地平線、比特大陸等公司都是這一領(lǐng)域的新貴。在產(chǎn)品形態(tài)上,他們大多采用ASIC方式將AI應(yīng)用固化在芯片中,從而獲得更低的成本和更高的性能及能效。當(dāng)然,傳統(tǒng)科技企業(yè)也沒有在這一領(lǐng)域缺席,包括Google的TPU、Intel的Arria 10系列(FPGA芯片)和Xilinx的Versal芯片(FPGA)等也紛紛進(jìn)入AI推理判斷領(lǐng)域。

與AI模型訓(xùn)練領(lǐng)域中NVIDIA的一家獨(dú)大不同,推理判斷領(lǐng)域卻呈現(xiàn)出了百家爭(zhēng)鳴、群雄逐鹿的景象。

云數(shù)據(jù)中心的AI隱憂

隨著云理念和云優(yōu)勢(shì)被越來越多的企業(yè)認(rèn)可,云計(jì)算市場(chǎng)也經(jīng)歷著一輪又一輪的高速增長(zhǎng)。而將AI能力通過云計(jì)算的形式交付給企業(yè)和用戶也成為了AI技術(shù)迅速發(fā)展并取得廣泛應(yīng)用的前提條件。于是,對(duì)于云數(shù)據(jù)中心來說各類計(jì)算卡和AI芯片就成為了擴(kuò)容建設(shè)的重中之重。

但隨著云計(jì)算市場(chǎng)和應(yīng)用集中趨勢(shì)的愈發(fā)明顯,很快,大型云數(shù)據(jù)中心就會(huì)發(fā)現(xiàn),越來越多的GPU、ASIC、FPGA會(huì)開始堆滿數(shù)據(jù)中心,他們分別運(yùn)行著不同的程序、發(fā)揮著不同的作用、并且有著不同的管理方式。而這對(duì)于數(shù)據(jù)中心來說則是一種巨大的挑戰(zhàn)。

二十年前,當(dāng)時(shí)的CPU性能遠(yuǎn)沒有現(xiàn)在的強(qiáng)大,而面對(duì)龐大的數(shù)據(jù)存儲(chǔ)和管理壓力,大多數(shù)企業(yè)都開始研發(fā)運(yùn)行效率更高的ASIC芯片,并使之成為存儲(chǔ)系統(tǒng)的核心功能實(shí)現(xiàn)單元。期初,這一思路取得了很好的效果,滿足的用戶的需求。但隨著時(shí)間得推移,越來越多不同廠牌、不同管理框架、不同功能的ASIC也讓存儲(chǔ)網(wǎng)絡(luò)的管理和運(yùn)營(yíng)成本直線飆升;最終受苦的仍舊是企業(yè)。直到現(xiàn)在,軟件定義存儲(chǔ)技術(shù)才開始慢慢扭轉(zhuǎn)這一局面,將企業(yè)從存儲(chǔ)系統(tǒng)結(jié)構(gòu)的深淵中慢慢拉出來。

而現(xiàn)在,數(shù)據(jù)中心雖然已經(jīng)實(shí)現(xiàn)了大面積的運(yùn)化,但CPU+GPU+FPGA+ASIC的復(fù)雜計(jì)算架構(gòu)卻仍舊有可能將企業(yè)拖入AI基礎(chǔ)設(shè)施的深淵,讓數(shù)據(jù)中心重新面臨二十年前的窘境。顯然,這一切在目前仍未引起足夠的重視。

誠(chéng)然,AI的崛起能夠讓企業(yè)在數(shù)字化時(shí)代的競(jìng)爭(zhēng)中獲得巨大的優(yōu)勢(shì),并有望徹底改變?nèi)藗兩詈推髽I(yè)運(yùn)行的效率和方式,但這種粗放型的發(fā)展思路卻仍舊值得數(shù)據(jù)中心管理者們的重視。

指望在復(fù)雜多變的AI市場(chǎng)建立統(tǒng)一的管理和運(yùn)行框架在目前這個(gè)時(shí)間節(jié)點(diǎn)是不現(xiàn)實(shí)的;寄希望于初出茅廬的AI芯片獨(dú)角獸們從整個(gè)數(shù)據(jù)中心未來管理和運(yùn)營(yíng)的角度來設(shè)計(jì)產(chǎn)品也不太可能。但從市場(chǎng)的規(guī)律來看,在沒有新的顛覆性技術(shù)出現(xiàn)之前,誰能夠解決好這一問題誰才有可能成為AI硬件市場(chǎng)未來真正的贏家。

基于這一點(diǎn),最有希望成為贏家的仍舊是Intel和Google這樣龐大企業(yè)。他們既有設(shè)計(jì)數(shù)據(jù)中心架構(gòu)的能力與經(jīng)驗(yàn),也有引領(lǐng)行業(yè)發(fā)展的資本和實(shí)力。而隸屬于華為的海思則也有可能憑借華為豐富的設(shè)備制造和系統(tǒng)構(gòu)建背景獲得未來市場(chǎng)的一杯羹。但對(duì)于地平線、比特大陸、寒武紀(jì)這樣最近幾年才嶄露頭角的新型企業(yè)來說,數(shù)據(jù)中心仍舊是一個(gè)龐大且無法掌控的存在,其未來最好的歸宿或許仍舊是被收購。

當(dāng)然,由于具備更相對(duì)更高的靈活性,F(xiàn)PGA和GPU方案仍舊可以很方便的與各種數(shù)據(jù)中心管理架構(gòu)兼容,這對(duì)于近來股價(jià)持續(xù)下跌的NVIDIA來說或許是一個(gè)好消息。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2019-02-26
AI將數(shù)據(jù)中心架構(gòu)再次拖向分裂?
自從Alpha GO戰(zhàn)勝人類圍棋選手以來,AI就成為了整個(gè)商業(yè)社會(huì)中熱度最高的一個(gè)名詞。在AI的背后是對(duì)傳統(tǒng)商業(yè)模式的巨大顛覆和對(duì)社會(huì)生產(chǎn)力的空前解放。

長(zhǎng)按掃碼 閱讀全文