如今,許多數(shù)據(jù)中心的每個 IT 機架的功率密度都在不斷增加,上升到幾年前看似極端且遙不可及的水平,但如今在部署空氣冷卻的同時被認為既常見又典型。例如,Uptime Institute在2020年的調(diào)查發(fā)現(xiàn),由于計算密集型工作負載,密度為20 kW及更高的機架正在成為許多數(shù)據(jù)中心的現(xiàn)實。
這種增長讓數(shù)據(jù)中心利益相關者想知道風冷 IT 設備 (ITE) 以及用于將冷供氣與熱廢氣分離的密封裝置是否最終達到了其極限,以及液體冷卻是否是長期解決方案。然而,答案并不像“是”或“否”那么簡單。
展望未來,預計數(shù)據(jù)中心將從100%風冷過渡到包含風冷和液冷解決方案的混合模型,所有新的和現(xiàn)有的風冷數(shù)據(jù)中心都需要密封以提高效率、性能和可持續(xù)性。此外,那些轉(zhuǎn)向液體冷卻的人可能仍然需要遏制來支持其關鍵任務應用,具體取決于部署的服務器技術的類型。
有人可能會問,為什么空氣冷卻與液體冷卻的爭論現(xiàn)在成為業(yè)界的熱門話題?為了回答這個問題,我們需要了解是什么推動了液體冷卻的需求、其他選擇,以及如何在繼續(xù)利用空氣作為主要冷卻機制的同時評估這些選擇。
風冷和液冷可以共存嗎?
對于那些剛進入數(shù)據(jù)行業(yè)的人來說,這是我們以前所處的位置,空氣和液體冷卻成功共存,同時通過板內(nèi)空氣-水熱交換器去除大量熱量。這個過程一直持續(xù)到 20 世紀 90 年代行業(yè)主要轉(zhuǎn)向 CMOS 技術為止,從那時起我們就一直在數(shù)據(jù)中心使用空氣冷卻。
由于空氣是數(shù)據(jù)中心冷卻的主要來源,ASHRAE(美國供暖、制冷和空調(diào)工程師協(xié)會)一直致力于使這項技術盡可能高效和可持續(xù)。自 2004 年以來,在 ITE 和冷卻系統(tǒng)制造商的參與下發(fā)布了一套冷卻 IT 服務器的通用標準,名為:TC9.9 數(shù)據(jù)處理環(huán)境熱指南。
ASHRAE 重點關注數(shù)據(jù)中心 ITE 冷卻的效率和可靠性。已發(fā)布多個修訂版本,最新版本于 2021 年發(fā)布(修訂版 5)。最新一代 TC9.9 突出了新型高密度風冷 ITE(H1 級),更注重冷卻高密度服務器和機架,但由于冷卻送風溫度較低,因此在能源效率方面進行了權衡建議冷卻 ITE。
至于空氣冷卻和液體冷卻是否可以在數(shù)據(jù)中心空白中共存的問題——這種情況已經(jīng)存在了幾十年,而且展望未來,許多專家預計這兩種冷卻技術將在未來幾年中共存。
服務器功耗趨勢揭示了什么?
人們很容易認為,在冷卻方面,無論是現(xiàn)在還是將來,一種尺寸都可以滿足所有功耗和冷卻消耗,但這并不準確。更重要的是關注我們正在設計或運營的數(shù)據(jù)中心的實際工作負載。
過去,對于空氣冷卻的一個常見假設是,一旦每個機架的功率超過25kW,就應該過渡到液體冷卻。但業(yè)界對此做出了一些改變,使數(shù)據(jù)中心能夠通過傳統(tǒng)風冷方式將每個機架冷卻至甚至超過35kW。
科學數(shù)據(jù)中心主要包括機器學習人工智能等 GPU 驅(qū)動的應用和加密貨幣挖掘等高級分析,是該行業(yè)通常正在向液體冷卻過渡或轉(zhuǎn)向的領域。但如果你看看其他一些工作負載,比如云和大多數(shù)企業(yè),增長率正在上升,但從成本角度來看,風冷仍然有意義。關鍵是從業(yè)務的角度看這個問題,我們每個數(shù)據(jù)中心要實現(xiàn)什么目標?
是什么推動了服務器功率的增長?
直到 2010 年左右,企業(yè)還在使用單核處理器,但一旦可用,他們就轉(zhuǎn)向多核處理器。然而,這些雙核和四核處理器的功耗仍然相對平穩(wěn)。這使得服務器制造商能夠?qū)W⒂诶鋮s ITE 的較低氣流速率,從而提高整體效率。
2018 年左右,隨著這些處理器的尺寸不斷縮小,更高的多核處理器成為常態(tài),隨著這些處理器達到性能極限,計算密集型應用程序繼續(xù)實現(xiàn)新性能水平的唯一方法是增加功耗。服務器制造商一直在盡可能多地安裝服務器,但由于CPU功耗,在某些情況下,數(shù)據(jù)中心很難通過空氣冷卻來散熱,從而需要替代冷卻解決方案,例如液體冷卻。
幾年來,服務器制造商也一直在提高服務器之間的溫度增量,這對效率也有很大幫助,因為溫度增量越高,散熱所需的氣流就越少。然而,服務器制造商反過來也達到了極限,導致數(shù)據(jù)中心運營商不得不增加氣流來冷卻高密度服務器并跟上不斷增加的功耗。
空氣冷卻的附加選項
值得慶幸的是,業(yè)界正在采用多種方法來成功冷卻每個機架高達甚至超過35 kW的功率密度,通常采用傳統(tǒng)的空氣冷卻。這些選項首先是部署冷通道或熱通道遏制。如果通常不使用密封裝置,則每個機架的機架密度不應高于5 kW,并需要額外的送風量來補償再循環(huán)空氣和熱點。
那么降低溫度呢?2021年,ASHRAE 發(fā)布了第五代 TC9.9,重點介紹了新型高密度風冷 IT 設備,該設備需要使用比上一類服務器更嚴格的供電溫度。
在某些時候,高密度服務器和機架也需要從空氣冷卻過渡到液體冷卻,特別是在未來幾年內(nèi),每個處理器的 CPU 和 GPU 預計將超500瓦或更高。但這種轉(zhuǎn)變不是自動的,也不適合所有人。
液體冷卻并不是滿足未來所有冷卻需求的理想解決方案或補救措施。相反,選擇液體冷卻而不是空氣冷卻與多種因素有關,包括特定位置、氣候(溫度/濕度)、功率密度、工作負載、效率、性能、熱再利用和可用物理空間。
這凸顯了數(shù)據(jù)中心利益相關者需要采取整體方法來冷卻其關鍵系統(tǒng)。它不會也不應該是我們只考慮空氣冷卻或液體冷卻的方法。相反,關鍵是要了解每種冷卻技術的權衡,并僅部署對應用最有意義的技術。
本文作者:Gordon Johnson, Senior CFD Engineer, Subzero Engineering
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 涉嫌違反限制性規(guī)定轉(zhuǎn)讓股票等行為 新易盛實控人、董事長高光榮被立案調(diào)查
- 天音移動:將100個虛商號段交還中國聯(lián)通
- 長沙電信員工反映加班嚴重 公司回應:避免無謂加班
- 中國移動11月5G網(wǎng)絡客戶凈增143萬戶,累計達5.47億戶
- 5G-A無源物聯(lián):夯實數(shù)字化底座,助力萬物智聯(lián)發(fā)展
- Wi-Fi7:6GHzWi-Fi如何支持醫(yī)療保健新時代
- 未來最值得關注的人工智能和機器學習趨勢是什么?
- 物聯(lián)網(wǎng)實現(xiàn)智能農(nóng)業(yè)的五大方式
- 人工智能在網(wǎng)絡安全中的作用
- 光迅科技:自研光芯片沒有直接對外銷售,主要滿足自用需求
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。