成立十年,這家由中科院孵化的超算中心憑什么登上中國(guó)高性能計(jì)算機(jī)Top100榜單第三名?

成立十年,這家由中科院孵化的超算中心憑什么登上中國(guó)高性能計(jì)算機(jī)Top100榜單第三名?

計(jì)算的商業(yè)化,何以搭上了「碳中和」的列車?

作者|陳彩嫻

編輯|岑峰

在2020 年中國(guó)高性能計(jì)算機(jī)性能 TOP100 的排行榜中,部署在國(guó)家超算中心(無錫)的「神威 · 太湖之光」依然穩(wěn)居第一,國(guó)家超算中心(廣州)的「天河二號(hào)升級(jí)系統(tǒng)」位列第二,而榮登榜眼的,卻是此前名不見經(jīng)傳的北京超級(jí)云計(jì)算中心 A 分區(qū)。

這一排名,讓許多此前并不知道北京超級(jí)云計(jì)算中心的朋友大吃一驚:「超級(jí)云計(jì)算」是什么?北京超級(jí)云計(jì)算中心的「A 分區(qū)」究竟實(shí)力何在?

盡管大家對(duì)A 分區(qū)的研制廠商戴爾(DELL)多有耳聞,但對(duì) A 分區(qū)所部署的北京超級(jí)云計(jì)算中心卻幾乎一無所知,顧名思義,更容易將其與國(guó)家超算中心混淆。

這座超算中心成立于2011 年,雖由中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心孵化、北京懷柔區(qū)政府支持成立,但卻不在國(guó)家的 8 個(gè)超算中心之列。

眾所周知,我國(guó)第一個(gè)國(guó)家超算中心成立于2009 年,由天津?yàn)I海新區(qū)與國(guó)防科技大學(xué)合作共建,斥資 6 億。此后,國(guó)家又陸續(xù)在多個(gè)東部城市建立了超算中心:濟(jì)南、深圳、廣州、長(zhǎng)沙、無錫、鄭州、昆山……

其「政府+ 高校」的合作模式雖與國(guó)家超算相似,但自創(chuàng)立之初,北京超級(jí)云計(jì)算中心的核心理念便注定了它的不同。

從2011 年到 2020 年,北京超級(jí)云計(jì)算中心何以從一個(gè)籍籍無名的超算中心,成為躋身于中國(guó)高性能計(jì)算機(jī) TOP100 榜單一員、并僅次于兩個(gè)國(guó)家超算中心的明星超算呢?

在中國(guó)高性能計(jì)算盛會(huì)CCF HPC China 2021 中,我們有幸采訪了北京超級(jí)云計(jì)算中心的 CTO 郭宇,與他一同探究該中心的「成名之道」。

從建設(shè)的模式來看,北京超級(jí)云計(jì)算中心與國(guó)家超算中心有許多不同之處,其中,最大的不同便是:國(guó)家超算中心注重科研支持,而北京超級(jí)云計(jì)算中心的核心理念是超算商業(yè)化。

按照郭宇的話說,是「像設(shè)計(jì)產(chǎn)品一樣設(shè)計(jì)超算?!?/p>

被譽(yù)為「國(guó)之重器」的超級(jí)計(jì)算機(jī),向來是大國(guó)之間的必爭(zhēng)之地。長(zhǎng)久以來,這也形成了國(guó)家超算獨(dú)當(dāng)一面、民間超算不為人知的局面。然而,任一行業(yè)的發(fā)展,必然是多方力量的融合與交匯,百花齊放,從而共同推進(jìn)領(lǐng)域的前進(jìn)。

那么,在中國(guó)的超算領(lǐng)域內(nèi),北京超級(jí)云計(jì)算中心的位置在哪里?優(yōu)勢(shì)是什么?

1

超算市場(chǎng)的形成

回顧2011 年北京超級(jí)云計(jì)算中心的成立節(jié)點(diǎn),除了兩個(gè)國(guó)家超算中心(天津與濟(jì)南)的成立所帶來的信號(hào),超算市場(chǎng)的爆發(fā)早在過去的五年便有了行業(yè)的鋪墊與基礎(chǔ):

2005 年以前,CPU 處理器處于「單核時(shí)代」,一個(gè) CPU 只有一個(gè)核心。如果一臺(tái)服務(wù)器上有兩個(gè) CPU,那么,搭建一個(gè) 1024 核的 CPU 則需要 512 個(gè)節(jié)點(diǎn),12 個(gè)機(jī)柜,因?yàn)橐粋€(gè)機(jī)柜最多只能裝40個(gè)節(jié)點(diǎn)。而每個(gè)機(jī)柜的寬度為 60 公分,12 個(gè)機(jī)柜則是 7.2 米,相當(dāng)于一個(gè)普通教室的寬度。

但從2006 年開始,CPU 處理器開始進(jìn)入了「雙核」、并逐步拓展到「多核」時(shí)代。雙核處理器的出現(xiàn),基于 x86 的計(jì)算架構(gòu),英特爾與 AMD 在 CPU 服務(wù)器市場(chǎng)中的主導(dǎo)地位也就此形成:

2006 年年中,AMD 率先推出 AM2 平臺(tái)。兩個(gè)月后,英特爾發(fā)布 Conroe,性能直接提高 40%,與此同時(shí),功耗也降低了 40%。但英特爾并不「就此罷休」,同年 11 月又直接推出全新的四核處理器 Kentsfield,直接把 CPU 推進(jìn)了「多核時(shí)代」。

與單核的CPU 相比,多核 CPU 的并行處理能力更強(qiáng)、計(jì)算密度也更高,并大大減少了散熱與功耗。后來,CPU 出現(xiàn)了 8 核、12 核、16 核……目前一個(gè) CPU 最高已能達(dá)到 64 核。對(duì)于許多關(guān)注高性能計(jì)算的行業(yè)從事人員來說,他們認(rèn)為,多核 CPU 必然會(huì)帶來計(jì)算與任務(wù)的并行化,也就是說,超算市場(chǎng)在未來會(huì)迎來爆發(fā)。

因此,回顧超算市場(chǎng)的發(fā)展歷史,在CPU 進(jìn)入「多核時(shí)代」后,北京超級(jí)云計(jì)算中心的成立,是卡在了CPU算力爆發(fā)的起點(diǎn)。但當(dāng)時(shí),北京超級(jí)云計(jì)算中心還未正式開始商業(yè)化的探索,前期工作也主要以維護(hù)中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心的超算集群,支持院內(nèi)科研項(xiàng)目為主。

除了技術(shù)的加持,國(guó)家超算中心的陸續(xù)成立,也逐漸在國(guó)內(nèi)孵化了一個(gè)算力的市場(chǎng)。

國(guó)家超算中心的建設(shè)模式是:科技部與地方政府各出一部分資金建設(shè)好國(guó)家超算中心后,在運(yùn)營(yíng)階段,超算中心的部分運(yùn)營(yíng)費(fèi)用由地方政府的財(cái)政補(bǔ)貼,同時(shí),國(guó)家部委和地方政府向部分高??蒲腥藛T開放課題申請(qǐng),由高??蒲腥藛T從課題經(jīng)費(fèi)中支出部分資金到國(guó)家超算中心去采購計(jì)算資源。

在這樣的模式下,國(guó)內(nèi)逐漸形成了一個(gè)商業(yè)循環(huán)的算力市場(chǎng)。隨著國(guó)家超算中心的出現(xiàn),科研院所與高校逐漸縮減自建超算的規(guī)模,增加對(duì)外部超算資源的采購。如此一來,超算市場(chǎng)的用戶越來越多,對(duì)超算的需求也不斷增加。當(dāng)市場(chǎng)擴(kuò)大到一定的程度,必然會(huì)出現(xiàn)分化,分為尖端超算市場(chǎng)、通用超算市場(chǎng)與行業(yè)超算市場(chǎng)。

對(duì)于國(guó)家超算中心來說,服務(wù)如此分化明顯的市場(chǎng)并不是一件易事,且國(guó)家超算中心存在的目的主要是支持國(guó)家大課題(如航空、宇宙、氣象等)、推進(jìn)科研進(jìn)步。這就造成了超算市場(chǎng)的服務(wù)縫隙:海量需要超算資源的小課題用戶在提出需求時(shí),并不能得到滿足。

正是看到超算市場(chǎng)的這一縫隙,2018 年,北京超級(jí)云計(jì)算中心開始了超算商業(yè)化的探索,希望能夠提供「隨需擴(kuò)容」的計(jì)算服務(wù),滿足尖端超算以外的大規(guī)模通用超算市場(chǎng)。

2

超算商業(yè)化探索

中國(guó)高性能計(jì)算機(jī)TOP100 的榜單排名由超級(jí)計(jì)算機(jī)計(jì)算能力決定,而計(jì)算能力主要由超級(jí)計(jì)算機(jī)的單節(jié)點(diǎn)性能與集群規(guī)模決定。

北京超級(jí)云計(jì)算A 分區(qū)的 Linpack 測(cè)試性能達(dá) 3.743PFlops,計(jì)算峰值性能達(dá) 7.035PFlops,CPU 核數(shù)達(dá)到 192000,幾乎是第四名往后的計(jì)算機(jī)的三倍及以上。

據(jù)郭宇介紹,A 分區(qū)從 2019 年年底開始建設(shè),而后在 2020 年逐步擴(kuò)容到 3000 節(jié)點(diǎn),背后的原因并不是為了爭(zhēng)奪 TOP3,而是為了滿足客戶的需求。

在郭宇看來,國(guó)內(nèi)的超算市場(chǎng)可以大致分為三類:尖端超算、通用超算與行業(yè)超算。其中,國(guó)家超算中心所服務(wù)的需求市場(chǎng),便主要是尖端超算市場(chǎng),滿足尖端超算需求的超級(jí)計(jì)算機(jī),以難度高、設(shè)計(jì)性能平衡為主,要兼顧計(jì)算、訪存、通信與I/O 等,服務(wù)對(duì)象是國(guó)家級(jí)的科研項(xiàng)目,重點(diǎn)是出成果,而不是盈利。

而北京超級(jí)云計(jì)算中心的目標(biāo)市場(chǎng)是通用超算,主要面向萬核以下(尤其是千核以下)的應(yīng)用,為需求不一的海量用戶提供租賃式超算服務(wù)。對(duì)于北京超級(jí)云計(jì)算中心來說,他們的目標(biāo)是超算的商業(yè)化運(yùn)營(yíng),實(shí)現(xiàn)超算業(yè)務(wù)的盈利,反哺到中心建設(shè)的投入中,實(shí)現(xiàn)自給自足、靈活外延的正循環(huán)。

「讓計(jì)算不排隊(duì)」,是北京超級(jí)云計(jì)算中心的核心理念。

從2011 年成立至今,北京超級(jí)云計(jì)算中心經(jīng)歷了兩個(gè)主要的階段:

剛成立的幾年,北京超級(jí)云計(jì)算中心以運(yùn)營(yíng)中科院體系內(nèi)的超算為主,包括中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心在2014 年推出的超級(jí)計(jì)算機(jī)「元」、2015 年的「元」二期等等。在這一階段,北京超級(jí)云計(jì)算中心的建設(shè)模式、運(yùn)營(yíng)模式與國(guó)家超算中心的體系有許多相同之處。

到了2017 年,他們逐漸發(fā)現(xiàn)了上述所說的國(guó)家超算中心無法滿足的外溢市場(chǎng)需求。隨著國(guó)內(nèi)科研發(fā)展的深入推進(jìn),高校教師對(duì)計(jì)算的需求越來越大,超算的用戶類型也越來越多,應(yīng)用越來越復(fù)雜,用戶對(duì)計(jì)算機(jī)的服務(wù)要求也越來越高。

比方說,有些用戶做計(jì)算,并不是簡(jiǎn)單地將一個(gè)程序放到超級(jí)計(jì)算機(jī)上就可以直接運(yùn)行,而是需要在Linux 命令行窗口下將源代碼進(jìn)行編譯、調(diào)優(yōu)、集成甚至更復(fù)雜的適配移植,這對(duì)廣大只熟悉 Windows 操作系統(tǒng)的用戶來說過于復(fù)雜。

國(guó)家超算中心的主要任務(wù)是支持重量級(jí)的科研項(xiàng)目,取得出色的學(xué)術(shù)成果,如此一來,國(guó)家超算中心的計(jì)算資源自然會(huì)優(yōu)先分配給重要的科研團(tuán)隊(duì),這就導(dǎo)致了許多中小用戶享受不到好的服務(wù),出現(xiàn)「排隊(duì)計(jì)算」的情況。

基于這一行業(yè)需求,北京超級(jí)云計(jì)算中心便思考從商業(yè)運(yùn)營(yíng)的角度去解決國(guó)家超算中心的這部分外溢需求,根據(jù)這部分通用超算客戶需求設(shè)計(jì)超級(jí)計(jì)算機(jī)和超算服務(wù)產(chǎn)品,通過靈活的方式將計(jì)算資源提供給超算市場(chǎng)的中小微「散戶」。

于是,2018 年,北京超級(jí)云計(jì)算中心發(fā)布了「中國(guó)科技云 · 超算云」,開始了超算商業(yè)化的探索征程。

他們以云服務(wù)的方式輸出超算資源,注重商業(yè)化運(yùn)營(yíng),遵循「隨需供應(yīng)」、「按需擴(kuò)容」的理念,在兩年間占領(lǐng)了一定的超算市場(chǎng),贏取了客戶的信任,在吸引更多中小用戶的過程中對(duì)A 分區(qū)進(jìn)行了擴(kuò)容與提升,最終在 2020 年贏得了中國(guó)高性能計(jì)算機(jī) TOP100 排行榜的第三名。

郭宇表示:「贏得TOP3 是結(jié)果,不是目的。我們打造超算,本心是為了服務(wù)客戶,獲得該榮譽(yù)是錦上添花?!?/p>

相對(duì)于聚焦TOP3 的排名,郭宇更希望大家看到 A 分區(qū)背后的北京超級(jí)云計(jì)算中心及其獨(dú)特的建設(shè)與運(yùn)營(yíng)模式。

3

關(guān)于「計(jì)算」模式的新思考

郭宇提出了一個(gè)有意思的觀點(diǎn):作為一種「產(chǎn)品」,超算的獨(dú)特之處在于,在用戶購買超算資源時(shí),用戶需要的并不是超級(jí)計(jì)算機(jī),而是想要解決問題。就像人們?cè)谫徺I電鉆時(shí),他們想要的并不是電鉆,而是電鉆在墻上鉆出的洞。

所以,在市場(chǎng)上推廣計(jì)算資源時(shí),北京超級(jí)云計(jì)算中心往往是強(qiáng)調(diào)「客戶服務(wù)」,而不只是中心的資源情況。

從A 分區(qū)來看,我們不難發(fā)現(xiàn),北京超級(jí)云計(jì)算中心與國(guó)家超算中心的模式多有不同:

首先是建設(shè)周期。國(guó)家超算中心由科技部或地方政府出資,超級(jí)計(jì)算機(jī)的項(xiàng)目申報(bào)需要經(jīng)過層層審批,建設(shè)周期一般為3-5 年,而 A 分區(qū)由北京超級(jí)云計(jì)算中心根據(jù)市場(chǎng)需求決定。此外,A 分區(qū)的建設(shè)主要基于市場(chǎng)上已有的技術(shù)設(shè)備,減少了技術(shù)攻關(guān)的時(shí)間成本。

比如,A 分區(qū)從 2019 年年底開始建設(shè),從一個(gè)試驗(yàn)性的小集群到面向用戶開放,2020 年年中擴(kuò)容,只用了5周便擴(kuò)容 1000 個(gè)節(jié)點(diǎn),后續(xù)又逐步擴(kuò)容至3000節(jié)點(diǎn)。

其次是分布位置。從地圖上看,我們不難發(fā)現(xiàn),國(guó)家超算中心基本分布在東部城市,而北京超級(jí)云計(jì)算中心的超算則主要分布在中西部,尤其是西部。A 分區(qū)便是分布在寧夏。超算中心是「耗電大戶」,從商業(yè)運(yùn)營(yíng)的角度看,西部的電價(jià)明顯更低。

在建設(shè)A 分區(qū)的時(shí)候,國(guó)家還沒有發(fā)布十四五計(jì)劃,「碳達(dá)峰」與「碳中和」的概念還未興起。郭宇談道,從北京超級(jí)云計(jì)算中心的角度來看,他們?cè)诮ㄔO(shè) A 分區(qū)時(shí),主要是遵循商業(yè)運(yùn)營(yíng)的邏輯,而今年「雙碳」熱點(diǎn)出現(xiàn)后,他們意外地發(fā)現(xiàn),自己的路線竟契合了國(guó)家的「雙碳」戰(zhàn)略。

「西部有風(fēng)力發(fā)電、光伏發(fā)電,能源豐富,而且年平均氣溫比較低,十分適合計(jì)算中心的生存,所以我們將西部作為主要的節(jié)點(diǎn)。而且超算業(yè)務(wù)對(duì)實(shí)時(shí)通訊的需求不高,用戶更關(guān)心的是產(chǎn)品的價(jià)格,至于機(jī)器是在本地、還是在幾千公里以外的西部,他們并不關(guān)心?!构罱忉?。

北京超級(jí)云計(jì)算中心面向通用超算,用戶數(shù)量大,符合長(zhǎng)尾效應(yīng)。郭宇談道:「有這些特點(diǎn)的市場(chǎng),是比較適合用互聯(lián)網(wǎng)的方式去服務(wù)的。一是降低單用戶的成本,二是貼身服務(wù)?!?/p>

所以,無論是計(jì)算選址的確定,還是「超算+ 云服務(wù)」的互聯(lián)網(wǎng)運(yùn)營(yíng)模式,都體現(xiàn)了北京超級(jí)云計(jì)算中心在計(jì)算供應(yīng)中注重靈活與性價(jià)比的特點(diǎn)。

從A 分區(qū)所搭配的 CPU 來看,也可窺見北京超級(jí)云計(jì)算中心的商業(yè)運(yùn)營(yíng)理念:

A 分區(qū)采用的是 AMD 在 2019 年推出的第二代 EPYC(霄龍)服務(wù)級(jí)處理器,代號(hào)羅馬(Rome),基于 7nm 工藝,搭載 64 核心 128 線程,在提升核心數(shù)量的同時(shí)也提升了時(shí)鐘速度,加速頻率可達(dá) 3.4GHz。

從計(jì)算機(jī)的角度來看,計(jì)算總共可以分為4 種類型:計(jì)算密集型、訪存密集型、存儲(chǔ)密集型(I/O 密集型)與網(wǎng)絡(luò)通信密集型。北京超級(jí)云計(jì)算中心的主要客戶是訪存密集型的應(yīng)用, A 分區(qū)用戶的特點(diǎn)是:計(jì)算規(guī)模不大,價(jià)格敏感。而羅馬處理器主頻適中,計(jì)算性能適中,能耗低,性價(jià)比高,顯然更有利于商業(yè)運(yùn)營(yíng)。

郭宇坦言,北京超級(jí)云計(jì)算中心的目標(biāo)并不是打造出像「神威· 太湖之光」或「天河二號(hào)升級(jí)系統(tǒng)」這樣各方面性能均衡又出色的超級(jí)計(jì)算機(jī),而是找到自己的市場(chǎng)定位,為目標(biāo)用戶提供適合他們的超算方案。

根據(jù)處理器的類別,北京超級(jí)云計(jì)算中心的超算分區(qū)可以劃分為四大系列:

基于AMD 芯片的 A 分區(qū)與 M 分區(qū),以及 A 分區(qū)的加強(qiáng)版「A6 分區(qū)」

基于英特爾芯片的T 分區(qū)與 L 分區(qū)

基于國(guó)產(chǎn)芯片的分區(qū)

基于英偉達(dá)芯片的AI 智算云,比如 N17、N19 區(qū)

根據(jù)不同用戶的需求,北京超級(jí)云計(jì)算中心設(shè)立了不同的分區(qū)去滿足這些需求。比如,榮登2020 年中國(guó)高性能計(jì)算機(jī) TOP100 榜單的 A 分區(qū)便是專門針對(duì)計(jì)算密集型與訪存密集型的用戶,存儲(chǔ)性能加強(qiáng)的 I/O 分區(qū)專門面向 I/O 密集型用戶等等。

「中國(guó)科技云· 超算云」匯聚了國(guó)家超算中心、互聯(lián)網(wǎng)云計(jì)算中心等資源,可以為用戶提供定制化的計(jì)算服務(wù)。同時(shí),他們揭開了高性能計(jì)算的「神秘面紗」,為用戶提供運(yùn)行問題解答、參數(shù)配置優(yōu)化、定制化腳本編寫等一系列服務(wù),更有一對(duì)一專屬微信群、7 × 24 小時(shí)人工值守與 5 分鐘快速響應(yīng)等機(jī)制。

4

自主研發(fā)離不開計(jì)算

近年來,越來越多企業(yè)高舉「自主研發(fā)」的旗幟。與此同時(shí),產(chǎn)品的迭代周期加快。為了快速滿足市場(chǎng)的需求,研發(fā)人員會(huì)越來越多地利用數(shù)字化技術(shù)進(jìn)行模擬仿真,其間產(chǎn)生大量數(shù)據(jù),對(duì)計(jì)算的需求也會(huì)越來越多。

事實(shí)上,從2010 年以來,許多企業(yè)也陸續(xù)建立了計(jì)算中心,但他們同樣面臨建設(shè)周期長(zhǎng)、內(nèi)部計(jì)算資源協(xié)調(diào)難、計(jì)算排長(zhǎng)隊(duì)的現(xiàn)象。企業(yè)一般是基于項(xiàng)目的優(yōu)先級(jí)進(jìn)行計(jì)算資源的分配,但人工協(xié)調(diào)的效率較低,影響了研發(fā)項(xiàng)目的進(jìn)展。

郭宇認(rèn)為,隨著人們對(duì)云計(jì)算優(yōu)勢(shì)的認(rèn)識(shí)加深,云計(jì)算的市場(chǎng)也在不斷擴(kuò)大。在新基建中,「數(shù)據(jù)中心」對(duì)應(yīng)的便是云計(jì)算,云計(jì)算是數(shù)字化轉(zhuǎn)型的基礎(chǔ)。同時(shí),隨著「雙碳」規(guī)劃的推進(jìn),碳排放指標(biāo)也將成為自建超算中心發(fā)展的限制因素之一。而北京超級(jí)云計(jì)算中心在分布位置上的先見之明,無疑將在未來的逐鹿上優(yōu)勢(shì)漸顯。

作為國(guó)內(nèi)第一家成規(guī)模的、市場(chǎng)化運(yùn)營(yíng)的超算中心,北京超級(jí)云計(jì)算中心的建設(shè)模式,啟示了中國(guó)超算市場(chǎng)的發(fā)展現(xiàn)狀:除了國(guó)家超算中心,越來越多由地方政府支持、市場(chǎng)化資本創(chuàng)辦的超算中心展示了其在推進(jìn)中國(guó)超算發(fā)展上的獨(dú)特優(yōu)勢(shì)。

比如,在2020 年中國(guó)高性能計(jì)算機(jī) TOP100 的榜單排名上,除了北京超級(jí)云計(jì)算中心 A 分區(qū)獲得佳績(jī),內(nèi)蒙古和林格爾新區(qū)的內(nèi)蒙古高性能計(jì)算公共服務(wù)平臺(tái)(青城之光)位居第四。

除了尖端超算與通用超算,中國(guó)的超算市場(chǎng)還有一股重要的力量:公有云廠商,比如阿里云、華為云與亞馬遜云(AWS)。北京超級(jí)云計(jì)算中心的另一塊重要業(yè)務(wù)——行業(yè)超算,便與這股力量有所交織與重疊。

行業(yè)超算更注重實(shí)際業(yè)務(wù),應(yīng)用規(guī)模為單核到幾千核不等,超算只是業(yè)務(wù)中的一環(huán)。比方說,在基因測(cè)序的過程中,基因測(cè)序儀產(chǎn)生大量數(shù)據(jù),這時(shí)候,如果數(shù)據(jù)存儲(chǔ)在云上,使用云的存儲(chǔ)、網(wǎng)絡(luò)與計(jì)算資源等等服務(wù)進(jìn)行基因的測(cè)序與分析,那么整個(gè)業(yè)務(wù)流程就會(huì)十分流暢。

對(duì)于這類業(yè)務(wù)流程,郭宇認(rèn)為,單靠通用超算是很難滿足的。從北京超級(jí)云計(jì)算中心的角度來看,他們會(huì)考慮將通用超算與云廠商的云服務(wù)資源相結(jié)合。除了核心的計(jì)算業(yè)務(wù),公有云廠商還提供豐富的云服務(wù)組件,能更好地解決用戶的問題。

「對(duì)用戶來說,解決問題最重要。至于計(jì)算資源來自哪里,他們并不在乎。我們就是要把各種優(yōu)勢(shì)的資源組合在一起,滿足客戶的需求?!构钫劦?。

從2018 年至今,北京超級(jí)云計(jì)算中心已服務(wù)超過 15 萬用戶, 已實(shí)現(xiàn)連續(xù)盈利。

比如,北京超級(jí)云計(jì)算中心曾支持中科院力學(xué)所研究中速磁浮列車的空氣動(dòng)力學(xué)外形優(yōu)化設(shè)計(jì)。中速磁浮列車氣動(dòng)外形優(yōu)化研究需要針對(duì)一系列優(yōu)化外形進(jìn)行數(shù)值模擬研究,對(duì)計(jì)算資源的要求較高,單工況網(wǎng)格量約6000 萬左右,流場(chǎng)特性研究及外形優(yōu)化研究中產(chǎn)生的計(jì)算工況上百計(jì)。

在這個(gè)項(xiàng)目中,北京超級(jí)云計(jì)算中心提供了可靈活拓展的大量計(jì)算節(jié)點(diǎn),保證了多任務(wù)的提交計(jì)算。最終,他們確定的最優(yōu)化流線外形,相對(duì)于原始外形,頭車氣動(dòng)升力系數(shù)增加了33.25%,尾車氣動(dòng)升力系數(shù)減少了 1.78%,整車氣動(dòng)阻力系數(shù)減小了 4.44%,大幅提升了中速磁浮列車的氣動(dòng)性能。

「從用戶的角度看,建設(shè)幾千核的計(jì)算資源,先不說時(shí)間,就投資成本來講,現(xiàn)在的主流服務(wù)器,一個(gè)節(jié)點(diǎn)大概是40 核心,如果他用的是 5000 核的計(jì)算資源,那么就需要 125 個(gè)節(jié)點(diǎn),125 個(gè)節(jié)點(diǎn)大概需要投資1200多萬,但他們的項(xiàng)目時(shí)長(zhǎng)只有兩個(gè)月?!构罱榻B。

因此,從投入產(chǎn)出比來看,對(duì)一些短期的項(xiàng)目來說,直接采購計(jì)算資源顯然更劃算。

5

計(jì)算緊跟時(shí)代

在郭宇看來,目前國(guó)內(nèi)的超算市場(chǎng)展示了以下三個(gè)趨勢(shì):

趨勢(shì)一:國(guó)內(nèi)的企業(yè)越發(fā)重視自主研發(fā),計(jì)算需求增加,同時(shí)也越來越愿意接受云計(jì)算的模式。

趨勢(shì)二:國(guó)產(chǎn)化的推進(jìn)加深。在超算體系中,芯片、操作系統(tǒng)、應(yīng)用等等方面的國(guó)產(chǎn)化趨勢(shì)將越來越明顯。

趨勢(shì)三:計(jì)算體系架構(gòu)正在革新。隨著人工智能、加速計(jì)算的興起,以異構(gòu)計(jì)算、加速卡為引導(dǎo)的GPU 力量正在崛起。

郭宇談起,他在2019 年去美國(guó)參加全球超級(jí)計(jì)算大會(huì)(SC19)時(shí),席間與美國(guó)高校的老師聊天,得到的訊息便是:「在現(xiàn)在的環(huán)境下,如果你沒有搞點(diǎn) GPU 的加速計(jì)算,文章都難發(fā)。從學(xué)術(shù)的角度看,CPU 體系已經(jīng)研究地差不多,下一個(gè)重點(diǎn)就是 GPU?!?/p>

2021 年正好是北京超級(jí)云計(jì)算中心成立的十周年。作為一家商業(yè)化運(yùn)營(yíng)的超算中心,郭宇介紹:「我們肯定會(huì)堅(jiān)定不移地走超算商業(yè)化的道路。與此同時(shí),他們也會(huì)與時(shí)俱進(jìn),根據(jù)國(guó)內(nèi)超算市場(chǎng)的發(fā)展趨勢(shì),制定新的發(fā)展方針。

緊跟學(xué)術(shù)界的研究趨勢(shì),北京超級(jí)云計(jì)算中心也加大了在GPU 計(jì)算領(lǐng)域的投入,建設(shè)基于 GPU 加速卡的計(jì)算分區(qū)。隨著人工智能計(jì)算的興起,以及異構(gòu)計(jì)算模式的變化,他們也順勢(shì)建立了「AI智算云」,以滿足部分從事人工智能研究學(xué)者的需求。

相應(yīng)地,針對(duì)企業(yè)的自主研發(fā)需求,北京超級(jí)云計(jì)算中心也逐步推出了一系列面向企業(yè)的計(jì)算資源,比如針對(duì)CAD 三維設(shè)計(jì)和中小規(guī)模 CAE 仿真計(jì)算的設(shè)計(jì)仿真云,支持海量中小企業(yè)實(shí)現(xiàn) " 云上研發(fā) ",可以極低成本起步,推動(dòng)中小企業(yè)高速發(fā)展,為國(guó)家中小企業(yè)發(fā)展打造堅(jiān)實(shí)云上研發(fā)平臺(tái)。針對(duì)超算體系國(guó)產(chǎn)化的趨勢(shì),他們也有了基于國(guó)產(chǎn)芯片的集群,與國(guó)產(chǎn)軟件廠商合作,通過云化的方式,幫助國(guó)產(chǎn)應(yīng)用更好地觸及用戶。

在郭宇看來,「讓計(jì)算不排隊(duì)」不僅是一句口號(hào),更是切實(shí)、堅(jiān)定的實(shí)踐。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )