CCF HPC China 2023 | 華為超融合以太網(wǎng)絡(luò)解決方案榮獲CCF創(chuàng)新獎,助“中國算力”高質(zhì)量發(fā)展

8月24日,在青島舉行的全國高性能計算學(xué)術(shù)年會大會(CCF HPC China 2023)上,由北京大學(xué)和華為技術(shù)有限公司聯(lián)合申報的超融合以太網(wǎng)絡(luò)榮獲解決方案創(chuàng)新獎。CCF是中國計算機(jī)學(xué)會的簡稱,CCF HPC China是高性能計算領(lǐng)域全球最具影響力的三大超算盛會之一,有著“中國超算風(fēng)向標(biāo)”的稱號。

如果說計算機(jī)領(lǐng)域,國際上的最高獎項是圖靈獎,那么國內(nèi)最高獎就是CCF頒發(fā)的獎項。知情人士介紹,能獲得CCF頒發(fā)的獎項,無疑是一個計算機(jī)學(xué)科的極高榮譽(yù)和實力體現(xiàn)。CCF創(chuàng)新獎旨在表彰在計算機(jī)科學(xué)、技術(shù)或網(wǎng)絡(luò)工程領(lǐng)域具有重要發(fā)現(xiàn)、發(fā)明、創(chuàng)新,在相關(guān)領(lǐng)域有國際影響的優(yōu)秀成果。獲得此獎項不僅代表著中國科技力量有能力創(chuàng)新性地解決算力落地中的實際問題,而且意味著未來我們可以將此類創(chuàng)新成果更好地分享給世界。

微信圖片_20230825102400.jpg

CCF副理事長金海頒獎(中)

北京大學(xué)計算中心付振新(左)

華為數(shù)據(jù)中心網(wǎng)絡(luò)領(lǐng)域副總裁張白領(lǐng)獎(右)

那么,此次北大和華為聯(lián)合獲得的創(chuàng)新成果到底有何含金量呢?讓我們仔細(xì)道來。

算力落地面臨擁堵難題

近年來,算力已經(jīng)像水、電一樣,滲透到生產(chǎn)生活的各個領(lǐng)域,成為經(jīng)濟(jì)社會高質(zhì)量發(fā)展的重要驅(qū)動力。目前,我國算力總規(guī)模居全球第二,保持30%左右的年增長率,新增算力設(shè)施中智能算力占比過半,成為算力增長的新引擎。一系列顯著增長點都讓人看到了屬于“中國算力”的勃勃生機(jī)。

從去年年底以來,ChatGPT引發(fā)了全球?qū)τ诖竽P偷年P(guān)注,由此點燃了千行百業(yè)對于AI訓(xùn)練的需求。各大高校和科研院所的計算平臺使用人數(shù)激增,用戶的作業(yè)量逐漸超過了平臺承受能力,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的業(yè)務(wù)吞吐量和復(fù)雜性都大大增加。如何破解擁堵難題,讓算力更好地服務(wù)高質(zhì)量發(fā)展已經(jīng)成為當(dāng)務(wù)之急。

北京大學(xué)選中華為超融合以太網(wǎng)絡(luò)解決方案

北京大學(xué)早在2018年就建成了高性能計算校級公共平臺,先后建成投用了“未名一號”“未名二號”“未名生科一號”等5套集群,共有732個節(jié)點、31000多個核心,計算峰值3.65PFLOPS,配備存儲14PB。

高性能計算校級公共平臺從整體上提升了北京大學(xué)的科研服務(wù)能力,降低了科研成本。截至2023年5月12日,該平臺為來自數(shù)學(xué)、力學(xué)、物理、化學(xué)、生物、地球科學(xué)等96個院系的5000多名師生提供了高性能計算服務(wù),支撐了545項科研課題,1400多篇科研論文,并支撐了2020年戈登貝爾獎的發(fā)布。

不過隨著平臺使用人數(shù)、計算任務(wù)的增加,網(wǎng)絡(luò)基礎(chǔ)設(shè)施的吞吐量和復(fù)雜性都大大增加,年均節(jié)點占用率都在80%以上,“未名生科一號”的節(jié)點占用率甚至長期處于95%以上,作業(yè)時間和排隊時間變得越來越漫長。

不能讓科研攻關(guān)任務(wù)堵在“臨門一腳”!為了提升高性能計算的效率,降低科研成本,北京大學(xué)高性能計算校級公共平臺組織了一次廠家“考核”,意在選出智能時代最優(yōu)的高性能計算網(wǎng)絡(luò)。通過嚴(yán)格測試,北京大學(xué)高性能計算校級公共平臺選擇采用華為超融合以太網(wǎng)絡(luò)解決方案,基于智能無損高性能計算網(wǎng)絡(luò)搭建高性能計算集群,100%釋放算力,縮短作業(yè)運行時間和排隊時間。

華為超融合以太網(wǎng)絡(luò)解決方案為何能脫穎而出

針對熱門大型公共計算平臺排隊和作業(yè)時間過長的問題,各廠商先后提出IB(Infiniband)、RoCEv1、RoCEv2等無損網(wǎng)絡(luò)技術(shù)。但是,通用計算區(qū)部署的傳統(tǒng)以太網(wǎng)、高性能計算區(qū)部署的IB網(wǎng)、存儲區(qū)部署的FC網(wǎng),是三張異構(gòu)網(wǎng)絡(luò),他們協(xié)議各異、架構(gòu)割裂,帶來了運維困難、專網(wǎng)生態(tài)封閉、成本高、無法實現(xiàn)全生命周期管理等問題。

華為超融合以太網(wǎng)絡(luò)解決方案獨家實現(xiàn)以太網(wǎng)0丟包,與傳統(tǒng)以太網(wǎng)相比,可實現(xiàn)服務(wù)器規(guī)模不變,算力翻番;可構(gòu)建10E級的超大規(guī)模算力集群;獨家實現(xiàn)網(wǎng)算一體,網(wǎng)絡(luò)協(xié)助計算,經(jīng)第三方權(quán)威測試機(jī)構(gòu)Tolly認(rèn)證,任務(wù)完成時間(JCT)對比IB 縮短17%。

此次北京大學(xué)和華為的聯(lián)合獲獎絕非偶然,這證明了超算行業(yè)技術(shù)圈對華為超融合以太網(wǎng)絡(luò)解決方案的充分認(rèn)可。

隨著數(shù)字產(chǎn)業(yè)智能化向智能世界發(fā)展,未來數(shù)據(jù)中心將朝著多云異構(gòu)算力演進(jìn),要構(gòu)建強(qiáng)大的算力,需要各類資源高度協(xié)同,深度融合。一張開放、自主的超融合以太網(wǎng)絡(luò)將多維度與各類算力資源協(xié)同,全面提升網(wǎng)絡(luò)性能,釋放更高算力,從而助力“高算力、高安全、高效能、高可靠”的新型算力中心建設(shè)。華為超融合以太網(wǎng)絡(luò)解決方案有望在國家科學(xué)計算、工程技術(shù)創(chuàng)新、高精尖科研算力使用和建設(shè)大潮中大顯身手,為“中國算力”的高質(zhì)量發(fā)展添薪續(xù)力。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )