液體冷卻如何克服高性能計(jì)算基礎(chǔ)設(shè)施相關(guān)挑戰(zhàn)

如今,距離新冠病毒大流行開始已有兩三年時(shí)間,為了維持我們?nèi)粘I畹墓δ?,?shù)據(jù)中心各行業(yè)的數(shù)字需求出現(xiàn)了前所未有的繁榮。例如,在醫(yī)療保健領(lǐng)域,遠(yuǎn)程醫(yī)療就診次數(shù)增加了63倍,從2019年的84萬次增至2020年的5270萬次。

據(jù)Gartner稱,最終用戶在公共云服務(wù)上的支出預(yù)計(jì)在2022年將達(dá)到4820億美元。在《哈佛商業(yè)評(píng)論》的一項(xiàng)調(diào)查中,86%的受訪者表示人工智能 (AI) 已成為其組織的主流技術(shù),67%的受訪者表示希望在2021年加速人工智能的采用。這些服務(wù)仍然像以往一樣重要,但它們只是觸及了網(wǎng)絡(luò)復(fù)雜性的表面。

隨著當(dāng)今的網(wǎng)絡(luò)變得更加復(fù)雜和分散,增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)應(yīng)用變得更加突出,對(duì)實(shí)時(shí)計(jì)算和決策的需求變得更加關(guān)鍵。這種實(shí)時(shí)需求對(duì)延遲很敏感,在企業(yè)、公有云、私有云、托管、邊緣日益普遍的混合模式下,專職人工管理變得越來越困難。

因此,人工智能和機(jī)器學(xué)習(xí) (ML) 對(duì)于優(yōu)化這些網(wǎng)絡(luò)的性能并為更多遠(yuǎn)程監(jiān)控解決方案讓路至關(guān)重要。5G的持續(xù)推出進(jìn)一步增加了我們的數(shù)字需求,5G的速度有望比其前身4G快500%,并且企業(yè)競相從2022年232 億美元的預(yù)計(jì)收入中分得一杯羹。

這些進(jìn)步不可避免地需要付出代價(jià)——計(jì)算和熱密度的增加。高性能計(jì)算 (HPC) 迅速加速支持AI、ML和5G,解決了眾多企業(yè)業(yè)務(wù)挑戰(zhàn)。對(duì)于許多數(shù)據(jù)中心運(yùn)營商來說,這很快就會(huì)產(chǎn)生對(duì)高密度機(jī)柜和數(shù)據(jù)中心的需求,需要改變基礎(chǔ)設(shè)施來冷卻這些關(guān)鍵系統(tǒng)。

隨著機(jī)架密度接近并超過30千瓦 (kW),無論系統(tǒng)如何優(yōu)化,空氣冷卻系統(tǒng)都可能不夠。盡管空氣冷卻技術(shù)在有效解決不斷增加的密度方面取得了長足的進(jìn)步,但在某種程度上,空氣根本不具備為高密度機(jī)架提供足夠冷卻所需的傳熱特性。忽視這些限制的組織應(yīng)該預(yù)見到更高的能源成本、更低的性能以及最終的延遲實(shí)施。

空氣冷卻最可行的替代方案是將液體冷卻引入機(jī)架。液體冷卻利用水或其他流體較高的傳熱特性來支持高密度機(jī)架的高效且經(jīng)濟(jì)高效的冷卻。液體冷卻有多種使用不同技術(shù)的配置,包括后門熱交換器、直接芯片冷卻和浸入式冷卻。

雖然液體冷卻通常被認(rèn)為是距離主流采用還需要數(shù)年時(shí)間的利基應(yīng)用,但Open19 基金會(huì)和開放計(jì)算項(xiàng)目等技術(shù)智庫匯聚了行業(yè)領(lǐng)導(dǎo)者,共同應(yīng)對(duì)計(jì)算密度持續(xù)增加帶來的挑戰(zhàn)。通過這些合作,行業(yè)領(lǐng)導(dǎo)者取得了巨大進(jìn)步,并開發(fā)了多種產(chǎn)品,幫助使液體冷卻技術(shù)成為更廣泛受眾的可行解決方案。

簡而言之,液體冷卻的工作原理如下:冷卻液體循環(huán)到嵌入IT設(shè)備中的冷板熱交換器。這提供了高效的冷卻,因?yàn)槔鋮s介質(zhì)直接進(jìn)入IT設(shè)備,而不是冷卻整個(gè)空間。它的效率比使用空氣高出3000 倍,使密集機(jī)架中的中央處理單元 (CPU) 和圖形處理單元 (GPU) 能夠以其最大電壓和時(shí)鐘頻率連續(xù)運(yùn)行而不會(huì)過熱。

再加上減少或消除數(shù)據(jù)中心和服務(wù)器中空氣流通所需的風(fēng)扇,可以為液冷數(shù)據(jù)中心帶來顯著的節(jié)能效果。此外,液體冷卻所需的泵比完成相同冷卻所需的風(fēng)扇消耗更少的功率。

液體冷卻的類型

后門熱交換器是一項(xiàng)成熟的技術(shù),它不會(huì)將液體直接輸送到服務(wù)器,而是利用液體的高傳熱特性。在無源后門熱交換器中,充滿液體的盤管安裝在機(jī)架后門的位置,當(dāng)服務(wù)器風(fēng)扇將熱空氣吹過機(jī)架時(shí),盤管會(huì)在空氣進(jìn)入數(shù)據(jù)中心之前吸收熱量。在主動(dòng)設(shè)計(jì)中,集成到設(shè)備中的風(fēng)扇將空氣吸入線圈以增強(qiáng)熱性能。

在直接芯片液體冷卻中,冷板位于服務(wù)器主要發(fā)熱組件的頂部,通過單相或兩相過程排出熱量。單相冷板使用循環(huán)到冷板中的冷卻液來吸收服務(wù)器組件的熱量。在兩相過程中,低壓介電液體流入蒸發(fā)器,服務(wù)器組件產(chǎn)生的熱量使流體沸騰。熱量以蒸汽形式從蒸發(fā)器中釋放出來,并轉(zhuǎn)移到機(jī)架外部以進(jìn)行排熱。

通過浸入式冷卻,機(jī)架中的服務(wù)器和其他組件浸沒在導(dǎo)熱介電液體或流體中。在單相浸沒系統(tǒng)中,熱量通過與服務(wù)器組件直接接觸傳遞到冷卻劑,并通過浸沒槽外部的熱交換器去除。在兩相浸沒式冷卻中,介電流體被設(shè)計(jì)為具有特定的沸點(diǎn),可以保護(hù) IT 設(shè)備,同時(shí)實(shí)現(xiàn)高效散熱。服務(wù)器發(fā)出的熱量改變了流體的相,上升的蒸汽通過位于水箱頂部的盤管冷凝回液體。

液體冷卻作為持續(xù)成功的路線圖

如果組織計(jì)劃使用液體冷卻來支持新的HPC相關(guān)基礎(chǔ)設(shè)施要求和挑戰(zhàn),那么除了效率和可靠性之外,還有其他一些好處。這些好處包括:

提高性能:液體冷卻系統(tǒng)不僅可以實(shí)現(xiàn)所需的可靠性,還可以帶來 IT 性能優(yōu)勢。當(dāng)處理器外殼溫度接近最大安全工作溫度時(shí)(空氣冷卻可能會(huì)發(fā)生這種情況),處理器性能會(huì)降低以避免熱失控。

可持續(xù)性:液體冷卻不僅創(chuàng)造了降低數(shù)據(jù)中心能耗并將電力使用效率 (PUE) 降至接近 1.0 的機(jī)會(huì),而且還提供了一種更有效的方法來重新利用捕獲的熱量,以減少對(duì)建筑供暖系統(tǒng)的需求。系統(tǒng)的回水溫度可以達(dá)到60 攝氏度或更高,并且液體到液體的熱傳遞比空氣系統(tǒng)更有效。

最大限度地提高空間利用率:液體冷卻帶來的密度使設(shè)施能夠更好地利用現(xiàn)有數(shù)據(jù)中心空間,從而無需擴(kuò)建或新建,或建造占地面積較小的設(shè)施。它還可以在物理空間有限的情況下支持處理密集型邊緣應(yīng)用程序。

降低總擁有成本 (TCO):在《數(shù)據(jù)中心液冷 IT 設(shè)備:總擁有成本》報(bào)告中,ASHRAE對(duì)風(fēng)冷數(shù)據(jù)中心與混合(風(fēng)冷和液冷)數(shù)據(jù)中心進(jìn)行了詳細(xì)的擁有成本分析數(shù)據(jù)中心模型發(fā)現(xiàn),雖然許多變量會(huì)影響TCO,但“液體冷卻可以通過更高的密度、增加自然冷卻的使用、提高性能和提高每瓦性能來改善TCO。”

對(duì)于應(yīng)對(duì)增加機(jī)架密度挑戰(zhàn)的組織領(lǐng)導(dǎo)者來說,可能是時(shí)候認(rèn)識(shí)到空氣冷卻的局限性并考慮使用液體冷卻來幫助實(shí)現(xiàn)能源和可持續(xù)發(fā)展目標(biāo)。對(duì)于那些部署極高密度機(jī)架(大于30kW)的人來說,可能沒有其他選擇。

然而,這是一個(gè)復(fù)雜的過程,因此企業(yè)組織與合適的合作伙伴合作以確保任何液體冷卻部署的成功非常重要。更多信息,可參考白皮書《了解數(shù)據(jù)中心液體冷卻選項(xiàng)和基礎(chǔ)設(shè)施要求》。

本文作者:Fred Rebarber 是 Vertiv 熱解決方案高級(jí)技術(shù)總監(jiān)

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2023-08-03
液體冷卻如何克服高性能計(jì)算基礎(chǔ)設(shè)施相關(guān)挑戰(zhàn)
液體冷卻有多種形式,但哪種形式更適合?Vertiv技術(shù)總監(jiān)Fred Rebarber分享了不同的選擇……

長按掃碼 閱讀全文