南京大學(xué)為什么要建那么大一個(gè)HPC集群?

摘要:作者|于澤(大數(shù)網(wǎng)副主編)去蕪存菁微信|YL09092014深入到實(shí)際案例中,發(fā)現(xiàn)攻下每一個(gè)客戶都不容易。只有不斷地重復(fù)這種不易,才能使你變得偉大。6月30日,2017聯(lián)想全球超算峰會(huì)(2017Len

作者 | 于澤 (大數(shù)網(wǎng)副主編)

去蕪存菁 微信|YL09092014

深入到實(shí)際案例中,發(fā)現(xiàn)攻下每一個(gè)客戶都不容易。只有不斷地重復(fù)這種不易,才能使你變得偉大。

6月30日,2017聯(lián)想全球超算峰會(huì)(2017 Lenovo HPC Summit)即將召開。而在此之前的6月27日,一場小規(guī)模的研討會(huì)率先在南京上演。主角是誰?南京大學(xué)和聯(lián)想。

聯(lián)想集團(tuán)數(shù)據(jù)中心業(yè)務(wù)教育行業(yè)總監(jiān)蔡斯揚(yáng)致辭

看起來這可能只是聯(lián)想高性能計(jì)算(High Performance Computing,HPC)在教育行業(yè)的一個(gè)具體案例,但折射的其實(shí)有很多。比如,南京大學(xué)為什么有代表性,教育行業(yè)在HPC領(lǐng)域的應(yīng)用情況如何,為什么南京大學(xué)最終選擇了聯(lián)想、被其哪些方面打動(dòng)等。

南京大學(xué)-HPC高教范本

一個(gè)一個(gè)來,由小到大,先說南京大學(xué)這個(gè)案例。

大背景是南京大學(xué)理工科非常強(qiáng),八個(gè)國家一級學(xué)科,中國語言文學(xué)、數(shù)學(xué)、物理學(xué)、化學(xué)、天文學(xué)、地質(zhì)學(xué)、生物學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)學(xué)中,有七個(gè)都需要大量的運(yùn)算。有了這個(gè)前提,不難理解為什么南京大學(xué)的HPC歷程可以追溯到那么早。

2001年,南京大學(xué)開始投資建設(shè)高性能計(jì)算中心,這也是中國最早一批高性能計(jì)算中心,后歷經(jīng)2005年、2007年先后立項(xiàng)擴(kuò)建;2009年,新建高性能計(jì)算中心,并在當(dāng)年的中國高性能計(jì)算機(jī)性能TOP100排行榜列第七位,高校系統(tǒng)第一位。2015年,南京大學(xué)高性能計(jì)算中心的擴(kuò)建再次提上日程。

截止當(dāng)前,南京大學(xué)高性能計(jì)算中心改造升級項(xiàng)目已經(jīng)結(jié)束,并正式投入運(yùn)營。

南京大學(xué)高性能計(jì)算中心一角

看兩組數(shù)據(jù),一是Linpack峰值(理論計(jì)算速度),它直接反映的是系統(tǒng)的性能,升級前的南京大學(xué)高性能計(jì)算集群(以下簡稱“一期”)Linpack峰值為每秒34萬億次,升級后的(以下簡稱“二期”)是844.8萬億次,是一期的近25倍。

二是系統(tǒng)規(guī)模,一期共402個(gè)計(jì)算節(jié)點(diǎn),每節(jié)點(diǎn)12GB內(nèi)存、2顆至強(qiáng)處理器,存儲(chǔ)是128TBSAN加上54TB并行存儲(chǔ);二期呢?880個(gè)計(jì)算節(jié)點(diǎn),每節(jié)點(diǎn)2顆至強(qiáng)處理器,內(nèi)存有兩種規(guī)格64GB和128GB,存儲(chǔ)是2PB的SAN加上超過1.2PB的并行存儲(chǔ)。

結(jié)合兩組數(shù)據(jù)能發(fā)現(xiàn)很多東西,比如二期規(guī)??雌饋硭坪踔槐纫黄诜艘槐?,但性能卻差近25倍,可見八年間信息技術(shù)發(fā)展之迅猛。

與此同時(shí),南京大學(xué)對高性能計(jì)算資源的需求增長之快可見一斑。南京大學(xué)高性能計(jì)算中心副主任董錦明在接受采訪時(shí)表示,擴(kuò)建后高性能計(jì)算中心的負(fù)載率目前在1/3左右,但他們預(yù)計(jì)一年后,就會(huì)達(dá)到80%。這并非盲目的樂觀,他解釋說,之前由于資源不足,很多老師都在外尋找計(jì)算資源,同時(shí)他們也拒掉了很多兄弟院校,以及企業(yè)的申請,把這些都算上,很快就會(huì)再次進(jìn)入資源相對緊張的狀態(tài)。

這是南京大學(xué)HPC方面的一些情況,從根本上說,他們升級是因?yàn)橘Y源不夠用了。而這很有代表性,足以體現(xiàn)行業(yè)趨勢,那就是高校對HPC需求量大,而且越來越大。

廣深交織-需求日益增加

為什么高校會(huì)有如此大的需求量?從更高的層面看,一、當(dāng)下是數(shù)據(jù)社會(huì),數(shù)據(jù)量正越來越大、再加上人們對數(shù)據(jù)分析效率的追求越來越高,這需要更為強(qiáng)大的計(jì)算力,二是信息技術(shù)這些年取得長足進(jìn)步,使得HPC的獲取變得簡單、容易,之前需要大量的人員、資源投入,現(xiàn)在以極少的代價(jià)就能享受其強(qiáng)大的能力。

聚焦高教,就如南京大學(xué)的情況,需要借助HPC的學(xué)科越來越多,越來越深。舉個(gè)例子,車輛設(shè)計(jì)需要HPC,但很多基礎(chǔ)的研究并不在汽車制造公司,比如材料、分子等。在哪?在高校、在研究所。車輛設(shè)計(jì)只是HPC應(yīng)用的一個(gè)門類,但高校覆蓋的是各個(gè)學(xué)科,物理、化學(xué)、生物……連接的是各行各業(yè),因此可能高校HPC在某一領(lǐng)域的應(yīng)用深度比不上產(chǎn)業(yè),但廣度絕對超過所有單一行業(yè)。

這是其一,高??蒲猩婕邦I(lǐng)域廣泛,需要HPC的地方多。其二,隨著研究的不斷深入,追趕國際領(lǐng)先水平腳步的日益加快,高校在單一領(lǐng)域?qū)PC的需求量也會(huì)與日俱增。

這可以理解為當(dāng)前高教領(lǐng)域?qū)PC需求的現(xiàn)狀,需求量大、重視程度日益增加,這一點(diǎn)從南京大學(xué)身上也能看出。

除此之外,事實(shí)上,從另一個(gè)側(cè)面也看出這一點(diǎn),那就是建設(shè)高性能計(jì)算中心的院校越來越多,這幾年僅聯(lián)想實(shí)施的就有北京大學(xué)超算中心、廈門大學(xué)化學(xué)化工學(xué)院超算中心、青海大學(xué)水利工程超算中心和南方科技大學(xué)新能源超算中心等十?dāng)?shù)個(gè),HPC在高教行業(yè)的發(fā)展速度可以想象。

聯(lián)想HPC-它們的一致選擇

為什么這么多院校會(huì)選擇聯(lián)想作為合作伙伴,聯(lián)想打動(dòng)他們的是什么?南京大學(xué)的案例或許能解釋其中的緣由。

南京大學(xué)高性能計(jì)算中心副主任周慶林教授

南京大學(xué)高性能計(jì)算中心副主任周慶林教授在采訪中談到了兩點(diǎn):一、先入為主,南京大學(xué)高性能計(jì)算中心上一套系統(tǒng)是IBM的,用的很好,穩(wěn)定、可靠,而聯(lián)想收購了IBM x86服務(wù)器業(yè)務(wù),沒理由不繼續(xù)使用。

二、聯(lián)想的實(shí)力,尤其是在高性能計(jì)算領(lǐng)域的實(shí)力。連續(xù)多年國內(nèi)HPC TOP100排行榜榜首,連續(xù)多屆國際HPC TOP500第二,不用再細(xì)說技術(shù)能力、服務(wù)能力,這些成績已經(jīng)說明了一切。

除此之外,他還講了一個(gè)小插曲,一個(gè)國際知名廠商已經(jīng)買了標(biāo)書了,最后投標(biāo)卻沒來。他猜想可能還是滿足不了南京大學(xué)的需求,可能是技術(shù)能力不足,也可能是實(shí)施能力不夠。

實(shí)際上,就如周慶林所分析的,技術(shù)實(shí)力跟聯(lián)想差不多的,服務(wù)能力未必跟得上;服務(wù)能力夠的,技術(shù)能力又不一定行。最終多方權(quán)衡,聯(lián)想是最好的選擇。

當(dāng)然,他們的選擇絕對是對的,聯(lián)想絕對有能力擔(dān)負(fù)起大家的期待。作為中國最早做HPC的廠商,聯(lián)想有足夠的積淀,并且在收購IBM x86服務(wù)器業(yè)務(wù)后,這些能力獲得進(jìn)一步增強(qiáng)。

看看聯(lián)想在HPC領(lǐng)域的布局,深騰X8800解決方案、水冷技術(shù)、LiCO智能超算平臺(tái)……再加上全球化的專業(yè)團(tuán)隊(duì),覆蓋應(yīng)用調(diào)研、方案設(shè)計(jì)、方案論證、應(yīng)用測試和優(yōu)化、現(xiàn)場安裝和實(shí)施端到端,以及開放心態(tài)下緊密無間的合作伙伴,其有今天的成績一點(diǎn)都不意外。

面向未來,聯(lián)想還在不斷的進(jìn)步,更好支持AI人工智能)的LiCO平臺(tái)、很快就要發(fā)布的Think System服務(wù)器產(chǎn)品線、團(tuán)隊(duì)進(jìn)一步的調(diào)整細(xì)化。據(jù)說30號還會(huì)有重大發(fā)布……一切為了客戶,明天自然不會(huì)差。

采訪手記

沒人能隨隨便便成功,4500萬大項(xiàng)目的背后,是雙方無數(shù)次的溝通交流、是很多人沒日沒夜的加班加點(diǎn)。就如聯(lián)想集團(tuán)蘇皖大區(qū)DCG業(yè)務(wù)總監(jiān)郝飛所透露,服務(wù)這個(gè)項(xiàng)目的一個(gè)20人的團(tuán)隊(duì)最忙的時(shí)候,十天時(shí)間平均每個(gè)人只睡一天。對此,周慶林他們笑笑說,我們真沒少提要求。

再想想聯(lián)想做了那么多這樣的項(xiàng)目,于是我寫下了開篇的第一句話。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-06-30
南京大學(xué)為什么要建那么大一個(gè)HPC集群?
摘要:作者|于澤(大數(shù)網(wǎng)副主編)去蕪存菁微信|YL09092014深入到實(shí)際案例中,發(fā)現(xiàn)攻下每一個(gè)客戶都不容易。只有不斷地重復(fù)這種不易,才能使你變得偉大。

長按掃碼 閱讀全文