異構(gòu)計算云計算的下一個戰(zhàn)場

摘要:神女應(yīng)無恙當驚世界殊科幻小說《三體》里,世界上最快的計算機,運算速度達到100萬億次,而如今的機器計算力可以達到500萬億次,超算可達萬億億次級別??茖W幻想面對當前現(xiàn)實的機器計算力,相形見絀很多了。這

神女應(yīng)無恙 當驚世界殊

科幻小說《三體》里,世界上最快的計算機,運算速度達到100萬億次,而如今的機器計算力可以達到500萬億次,超算可達萬億億次級別。

科學幻想面對當前現(xiàn)實的機器計算力,相形見絀很多了。

這是什么神力,讓科學幻想也趕不上世事的滄桑變化?

異構(gòu)計算推進算力極大的提高,人工智能再提速

我們可以從最近阿里云新產(chǎn)品發(fā)布會中管窺一斑。

9月12日,阿里云異構(gòu)計算家族首次完美亮相,推出全新一代異構(gòu)加速平臺——涵蓋GPU、FPGA在內(nèi)等6款異構(gòu)實例,可滿足從圖形渲染到高性能計算及人工智能等復雜應(yīng)用的計算需求。其中新一代FPGA計算實例F2,基于Xilinx硬件可編程芯片打造,可為人工智能產(chǎn)業(yè)提供加速服務(wù),在特定場景下的處理效率比CPU高30倍,而人工智能產(chǎn)業(yè)用戶可通過GN5i搭建微秒級響應(yīng)的AI服務(wù),可將深度學習成本縮減50%以上,大幅降低人工智能計算門檻。

與此同時,針對傳統(tǒng)對高性能計算有強烈需求的高校科研機構(gòu)和企業(yè)用戶,推出的基于阿里云異構(gòu)平臺的全新高性能計算實例E-HPC,可一鍵部署獲得媲美大型超算集群環(huán)境的“云上超算中心”。E-HPC也是中國首個公共云上的HPC as a Service產(chǎn)品。

這是繼企業(yè)級ECS家族全線升級后,阿里云再次在企業(yè)級市場推出專業(yè)服務(wù),新品具備更強的并行能力和多場景支持,不僅全力支撐人工智能計算力升級需求,也為圖形計算、生命科學、材料力學、分子動力學等科研計算領(lǐng)域提供超強普惠計算能力。

數(shù)據(jù)、算力和算法,這是未來科學技術(shù)也是科技一大潮流人工智能發(fā)展的三大要素。而這一切都要基于云計算。從功能而言,云計算是極其強大的,它可極大地提高信息計算處理能力,徹底降低計算機軟硬件的投資,并大大地降低信息服務(wù)的復雜性,根本改變了計算與存儲的方式,使云計算成為未來互聯(lián)運行指揮的“大腦”。比如北京超級云計算中心計算能力為每秒500萬億次未來甚至可達1000萬億次,而這一切離不開阿里云、騰訊云、華為云、電信云等國內(nèi)知名云計算服務(wù)廠商的貢獻。2017中國云計算企業(yè)百強榜近日出爐,阿里云穩(wěn)居第一,再次宣示阿里云在云計算霸主地位不可動搖。2015年阿里云宣布聯(lián)合中科大研制量子計算機,10-15年后速度將超天河二號百億億倍。這說明高速發(fā)展的云計算計算力正推動著當前人類科技的巔峰人工智能及各項科技產(chǎn)業(yè)更大規(guī)模地爆發(fā)。

如今人工智能、深度學習已經(jīng)成為產(chǎn)業(yè)界一股強烈浪潮,對各行各業(yè)都將產(chǎn)生深遠影響。而人工智能、深度學習對計算能力的要求相當?shù)母?,要求擁有比傳統(tǒng)服務(wù)器強大得多的計算能力和每瓦計算能力,能夠滿足人工智能、深度學習對強大計算性能、計算能效以及計算實時性的最大需求,以推動和加速整個人工智能、深度學習生態(tài)的迅速發(fā)展。

而此番阿里云推出的異構(gòu)計算加速平臺,主要就是為了進一步完善人工智能產(chǎn)業(yè)生態(tài),滿足更多客戶的核心業(yè)務(wù)需求。阿里云此次推出適用于深度學習在線推理(Inference)的GPU實例GN5i,采用了英偉達Pascal架構(gòu)P4圖形處理器,提供最大45Tops INT8整型計算能力和11TFlops FP32單精度浮點計算能力。可根據(jù)深度學習計算力的要求,進行GPU實例的“Scale-out:水平擴容或“Scale-up”垂直變配,分鐘級即可完成實例的創(chuàng)建。2017年初,阿里云就推出基于英特爾Arria 10芯片的FPGA計算實例,有效提升了人工智能及深度學習的效率,為企業(yè)節(jié)省成本。而此次發(fā)布的F2實例基于賽靈思Xilinx KU115器件,提供145萬邏輯門電路,單實例的單精度浮點計算性能可達1.5TFlops,“馬力”超強。

隨著集成英特爾(F1)和賽靈思(F2)芯片的FPGA計算實例相繼問世,加上阿里云業(yè)已推出的FPGA鏡像市場,阿里云率先完成對主流FPGA方案的全覆蓋,成為全球FPGA領(lǐng)域產(chǎn)品線最全、場景最多的公共云服務(wù)商。

應(yīng)運而生,異構(gòu)計算挑起計算大梁的關(guān)鍵技術(shù)

近10年來,計算行業(yè)經(jīng)歷了從32bit、x86-64、多核心、通用GPGPU以及2010年“CPU—GPU”異構(gòu)計算的變遷。而這幾年,隨著人工智能、高性能數(shù)據(jù)分析和金融分析等計算密集型領(lǐng)域的興起,異構(gòu)計算日益火爆起來。

然而在光鮮華麗的表象之下,對于一般用戶來說,異構(gòu)計算的采購、部署以及使用門檻對絕大多數(shù)企業(yè)來說都很高。

痛點如下:1、采購成本居高不少:普通用戶小量采購基本上沒有議價能力,特別是購買試用的FPGA、開發(fā)板還有服務(wù)器,量少的話采購價格非常高。而阿里云從芯片原廠、OEM統(tǒng)一采購芯片和機器,不需要經(jīng)過層層代理,大大降低采購成本,而且在云上提供按需使用的FPGA對于普通FPGA開發(fā)者來說,讓使用成本得到極大降低。

2、開發(fā)難度大:就是現(xiàn)有的FPGA開發(fā)工具不太友好,而且像Verilog和VHDL這樣的開發(fā)語言,學習的門檻比較高。所以對開發(fā)者來說,要想開發(fā)出性能比較高的軟件,需要對FPGA了解非常深入才行,因此開發(fā)難度比較大。

3、交付周期長:通常用戶從開始需要采購,到機型選擇、硬件架構(gòu)設(shè)計、供應(yīng)商選擇、機房選擇、財務(wù)審批等流程通常需要幾個月的時間,費時費力;

4、采購不靈活難于把控:采購完了GPU/FPGA的數(shù)量就固定了,任務(wù)少的話多買的GPU/FPGA就浪費了,任務(wù)多的話GPU/FPGA數(shù)量又不夠用。

因此,傳統(tǒng)通用計算的方式已經(jīng)難于滿足人們對計算能力的高要求,異構(gòu)計算被認為是現(xiàn)階段能挑起計算大梁的關(guān)鍵技術(shù),阿里云異構(gòu)計算產(chǎn)品解決方案就在這樣的大環(huán)境下應(yīng)運而生了。

目前“CPU+GPU”以及“CPU+FPGA”都是最受業(yè)界關(guān)注的異構(gòu)計算平臺,

優(yōu)點明顯:1、GPU/FPGA資源即買即用,靈活自如。有了E-HPC,企業(yè)就能快速獲得高性能計算集群能力,高性能計算調(diào)度能力和軟件能力,按需組建自己的“云上超算中心”,再也不用一次性巨額資金投入,對高性能計算有需求的企業(yè)可以隨買隨用,從而幫助降低購買門檻、計算成本,提高計算靈活性。目前,阿里云E-HPC已向國內(nèi)用戶開放邀測,支持包月包年和按需付費。據(jù)悉,該產(chǎn)品不久將實現(xiàn)全球同步售賣。

2、超大規(guī)模資源池,滿足業(yè)務(wù)峰值的GPU/FPGA大規(guī)模的數(shù)量需求。

3、享受異構(gòu)計算超摩爾定律的硬件紅利,以相同的價格使用性能更強的GPU/FPGA實例;

4、全面的異構(gòu)產(chǎn)品線,滿足人工智能訓練、推理,圖像視頻處理等各種不同的需求。對于AI來說,阿里這套解決方案能非常好地加速AI領(lǐng)域的訓練和預(yù)測/分類等問題,包括圖像識別、語音識別、視頻識別、視頻監(jiān)控、文字識別、人臉識別、車輛識別、自動駕駛、機器翻譯等AI的應(yīng)用場景。

5、產(chǎn)品整合:和整個阿里云產(chǎn)品體系深度整合,數(shù)據(jù)打通。

目前,中國的天河2號、天河1號、曙光6000都是異構(gòu)超算,而天河2A和下一代曙光7000超算和神威超算也是異構(gòu)超算,同構(gòu)的超算只有神威藍光。異構(gòu)超算已成為云計算的共同選擇了。

未來在云服務(wù)器行業(yè),誰在計算、存儲、網(wǎng)絡(luò)三者上做到最好,更高的穩(wěn)定性、更高的彈性和易用性、更高的安全性、更低的成本,誰就拔得頭籌。

免責聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個人觀點,與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請自行核實相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-09-19
異構(gòu)計算云計算的下一個戰(zhàn)場
摘要:神女應(yīng)無恙當驚世界殊科幻小說《三體》里,世界上最快的計算機,運算速度達到100萬億次,而如今的機器計算力可以達到500萬億次,超算可達萬億億次級別。

長按掃碼 閱讀全文