UCloud優(yōu)刻得榮獲IDCC長三角綠色算力基礎(chǔ)設(shè)施獎,以智算底座助推大模型產(chǎn)業(yè)發(fā)展

2023年8月31日,第十八屆中國IDC產(chǎn)業(yè)(長三角)年度大典在上海召開,本次大會重點關(guān)注生成式AI和大模型對算力產(chǎn)業(yè)所帶來的變革,通過交流探討算力產(chǎn)業(yè)趨勢及應(yīng)用,促進(jìn)算力產(chǎn)業(yè)的互聯(lián)互通與創(chuàng)新發(fā)展,為打造數(shù)字未來提供堅實支撐。

憑借在上海青浦?jǐn)?shù)據(jù)中心自主研發(fā)的“白露”間接蒸發(fā)冷卻技術(shù)、“啟蟄”余熱回收利用等多項數(shù)據(jù)中心創(chuàng)新技術(shù),UCloud優(yōu)刻得在本次IDC產(chǎn)業(yè)年度大典榮獲“IDCC 2023長三角區(qū)域綠色算力基礎(chǔ)設(shè)施獎”。

上海市通信管理局最新發(fā)布的新型數(shù)據(jù)中心“算力浦江”行動計劃2023年度重點任務(wù)提出:持續(xù)統(tǒng)籌優(yōu)化算力布局、筑強(qiáng)新型算力網(wǎng)絡(luò)體系、提升算力賦能應(yīng)用水平、推動算力產(chǎn)業(yè)創(chuàng)新發(fā)展、促進(jìn)綠色低碳算力發(fā)展、加強(qiáng)算力安全防護(hù)水平。

長三角地區(qū)是我國算力產(chǎn)業(yè)的重要聚集地,也是人工智能、金融、游戲等數(shù)字產(chǎn)業(yè)的創(chuàng)新高地。UCloud優(yōu)刻得上海數(shù)據(jù)中心正好位于長三角國家算力網(wǎng)絡(luò)樞紐節(jié)點起步區(qū)的上海市青浦工業(yè)園區(qū),符合國標(biāo)A級數(shù)據(jù)中心標(biāo)準(zhǔn),具備良好的網(wǎng)絡(luò)條件和資源配套,可有效承載金融市場高頻交易、遠(yuǎn)程醫(yī)療、AI推理等對實時數(shù)據(jù)分析和網(wǎng)絡(luò)條件要求較高的企業(yè)數(shù)字化業(yè)務(wù)。

為實現(xiàn)“雙碳”目標(biāo),UCloud優(yōu)刻得在數(shù)據(jù)中心的設(shè)計和建設(shè)過程中始終秉持著“綠色、低碳、環(huán)保”的發(fā)展理念,采用自然冷卻、余熱回收利用、露點式間接蒸發(fā)冷卻,并充分利用光伏發(fā)電、智能照明、能源管理與智能控制等眾多先進(jìn)的節(jié)能技術(shù),實現(xiàn)了低于1.3的PUE值,大幅降低了數(shù)據(jù)中心的碳排放量,提升綠色化水平。

“白露”間接蒸發(fā)冷卻是UCloud優(yōu)刻得自主研發(fā)的專利技術(shù),重構(gòu)了間接蒸發(fā)冷卻流程,將送風(fēng)極限由室外濕球溫度調(diào)整為室外露點溫度,極大的提高了制冷效率、降低數(shù)據(jù)中心能耗;“啟蟄”數(shù)據(jù)中心余熱回收技術(shù),創(chuàng)造性地提出“集散分離、遠(yuǎn)近兩宜”的余熱回收利用理念,利用集中式余熱回收方案來實現(xiàn)熱量的遠(yuǎn)距離輸送和利用,分布式余熱回收方案來實現(xiàn)熱量的就近利用,以此保障余熱利用效率。

在大會的“算力底座,承載數(shù)智未來”主題篇章,UCloud優(yōu)刻得服務(wù)器中心總監(jiān)丁振雷結(jié)合自建數(shù)據(jù)中心的系統(tǒng)工程經(jīng)驗進(jìn)行了內(nèi)容演講,與大家分享了UCloud優(yōu)刻得作為中立云計算廠商為AI大模型構(gòu)建智能算力基礎(chǔ)設(shè)施的實踐與思考。

大模型發(fā)展勢必需要重資產(chǎn)的投入,同時構(gòu)建千卡規(guī)模的算力集群是一項復(fù)雜的系統(tǒng)工程,數(shù)據(jù)中心高功率機(jī)柜的選擇、高速算力網(wǎng)絡(luò)的建立健全、GPU服務(wù)器的選型等,都是行業(yè)所面臨的痛點。而云廠商的價值在于,通過多年成熟的云服務(wù)經(jīng)驗和工程實踐能力,幫助用戶降低大模型的研發(fā)門檻和投入成本。

根據(jù)“東數(shù)西算”國家戰(zhàn)略,UCloud優(yōu)刻得自建了烏蘭察布和上海青浦兩大高標(biāo)準(zhǔn)、高性價比的數(shù)據(jù)中心,支持機(jī)房模塊布置、基礎(chǔ)設(shè)施配置的靈活部署、深度定制,可提供從數(shù)據(jù)中心、服務(wù)器、到計算、存儲、網(wǎng)絡(luò)、安全、架構(gòu)設(shè)計的一整套AIGC解決方案,將產(chǎn)品能力轉(zhuǎn)化成差異性的服務(wù)交付給客戶,為企業(yè)構(gòu)建穩(wěn)定可靠的大模型算力底座。

大會現(xiàn)場,丁振雷從電力功耗、存儲、網(wǎng)絡(luò)等方面介紹了當(dāng)前大模型發(fā)展所面臨的挑戰(zhàn)。滿足大模型訓(xùn)練要求的機(jī)房需要以高電機(jī)柜支撐高性能GPU算力服務(wù)器的運行,同時還需要承擔(dān)高昂的電費成本。UCloud優(yōu)刻得烏蘭察布數(shù)據(jù)中心具備電力充分、電費低廉、可自然制冷等優(yōu)勢,相較于北京、上海等同質(zhì)量數(shù)據(jù)中心成本可下降40%。數(shù)據(jù)中心內(nèi)提供A800/H800等多款適用于模型訓(xùn)練和推理等不同場景的GPU算力資源,可充分滿足大模型算力集群的高電需求,實現(xiàn)“訓(xùn)推一體”、“東推西訓(xùn)”,這種“算力租賃”的方式也會極大的降低使用者的成本。

大模型訓(xùn)練依賴于大規(guī)模分布式并行集群,且GPU服務(wù)器之間需要確保高速網(wǎng)絡(luò)互聯(lián),大模型訓(xùn)練的RDMA網(wǎng)絡(luò)設(shè)計要滿足“大規(guī)模、高帶寬”的要求?;谠诠性拼笠?guī)模使用RoCE網(wǎng)絡(luò)的工程經(jīng)驗,UCloud優(yōu)刻得自建大模型訓(xùn)練集群RoCE網(wǎng)絡(luò),有效滿足算力集群對高速網(wǎng)絡(luò)的性能需求,支持萬張以上的GPU同時接入。

基于大模型訓(xùn)練對存儲系統(tǒng)高讀寫吞吐的要求,UCloud優(yōu)刻得升級了基于US3對象存儲的冷熱分離的分布式文件系統(tǒng)。支持本地文件形式掛載,易于適配;GPU節(jié)點可使用本地NVMe磁盤作為近端緩存,滿足多層次加速需求;此外還提供高性能和容量一體方案,以滿足訓(xùn)練數(shù)據(jù)集的訓(xùn)練數(shù)據(jù)和CheckPoint數(shù)據(jù)長期的大容量存儲需求,以此實現(xiàn)模型訓(xùn)練效率提升。

在圓桌對話環(huán)節(jié),UCloud優(yōu)刻得混合云業(yè)務(wù)中心總經(jīng)理唐立參與探討了“智算變局下商業(yè)模式的轉(zhuǎn)型與創(chuàng)新”。唐立表示,大模型引爆了算力需求,也驅(qū)動數(shù)據(jù)中心向智算中心轉(zhuǎn)變,擁有成熟的算力部署能力,以及從拿到卡到構(gòu)建整體算力平臺的一體化工程交付能力,才能追趕上這一波的浪潮和機(jī)遇。UCloud優(yōu)刻得可以提供GPU算力資源、托管算力底座和部署方案,聯(lián)動高性能網(wǎng)絡(luò)、存儲系統(tǒng)等一整套的解決方案,為AIGC發(fā)展提供智算基礎(chǔ)設(shè)施支撐。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )