數(shù)據(jù)中心故障原因有哪些?

如果想增加數(shù)據(jù)中心的正常運(yùn)行時(shí)間,需要識(shí)別并緩解最常見的中斷源。這可能很有挑戰(zhàn)性,因?yàn)閿?shù)據(jù)中心可能出現(xiàn)故障的原因有很多,而且通常不可能解決每一個(gè)問題。相反,數(shù)據(jù)中心運(yùn)營商必須決定優(yōu)先考慮哪些正常運(yùn)行時(shí)間威脅。

數(shù)據(jù)中心正常運(yùn)行的最大威脅

您可能會(huì)認(rèn)為數(shù)據(jù)中心停機(jī)的最常見原因是網(wǎng)絡(luò)攻擊或極端天氣等風(fēng)險(xiǎn),這些風(fēng)險(xiǎn)一旦發(fā)生往往會(huì)引起媒體的廣泛關(guān)注。

但實(shí)際上,從數(shù)據(jù)中心正常運(yùn)行時(shí)間的角度來看,這些風(fēng)險(xiǎn)可以忽略不計(jì)。大多數(shù)數(shù)據(jù)中心故障的核心問題分為以下幾類:

1.物理系統(tǒng)故障

數(shù)據(jù)中心故障最常見的原因是電源問題,根據(jù)報(bào)告顯示,電源問題占所有數(shù)據(jù)中心故障的52%。另外19%的停電事件源于數(shù)據(jù)中心冷卻問題,該研究所將其與電力系統(tǒng)問題分開分類。

這意味著,到目前為止,數(shù)據(jù)中心正常運(yùn)行的最大風(fēng)險(xiǎn)是物理系統(tǒng)故障。想要提高正常運(yùn)行時(shí)間的數(shù)據(jù)中心運(yùn)營商應(yīng)該投資于冗余能源供應(yīng)或HVAC系統(tǒng)等解決方案。

2.第三方提供商的挑戰(zhàn)

對(duì)數(shù)據(jù)中心正常運(yùn)行時(shí)間的第二大威脅是第三方供應(yīng)商問題。這意味著由服務(wù)提供商(企業(yè)通過外包協(xié)議或類似安排與其簽約管理數(shù)據(jù)中心)造成的故障。

很難說將數(shù)據(jù)中心運(yùn)營轉(zhuǎn)移到企業(yè)內(nèi)部是否會(huì)緩解這個(gè)問題。似乎可以推斷,專注于日常數(shù)據(jù)中心運(yùn)營的數(shù)據(jù)中心外包企業(yè),可能比數(shù)據(jù)中心管理不是重點(diǎn)的企業(yè)實(shí)現(xiàn)更好的正常運(yùn)行時(shí)間率。但在這方面的里程可能會(huì)有所不同,這取決于內(nèi)部員工在管理數(shù)據(jù)中心方面的熟練程度。

無論如何,如果您選擇第三方提供商來管理數(shù)據(jù)中心運(yùn)營,應(yīng)該詢問其正常運(yùn)行時(shí)間記錄,以確保提供商不會(huì)成為數(shù)據(jù)中心可用性策略中最薄弱的環(huán)節(jié)。

3.IT設(shè)備故障

IT系統(tǒng)硬件和軟件故障是數(shù)據(jù)中心停機(jī)的第三大常見原因。這并不奇怪,因?yàn)樽詳?shù)字時(shí)代來臨以來,企業(yè)一直在努力應(yīng)對(duì)服務(wù)器崩潰的問題。

雖然沒有靈丹妙藥可以減輕這種風(fēng)險(xiǎn),但有一些行之有效的策略。比如投資更好的監(jiān)控和可觀察性解決方案,并創(chuàng)建帶有自動(dòng)故障轉(zhuǎn)移控制的備份IT環(huán)境,以便如果服務(wù)器崩潰,其工作負(fù)載可以立即轉(zhuǎn)移到另一臺(tái)服務(wù)器。

4.網(wǎng)絡(luò)故障

網(wǎng)絡(luò)故障與IT設(shè)備故障類似:它們導(dǎo)致數(shù)據(jù)中心停機(jī)的概率幾乎完全相同,而且是企業(yè)長期以來一直在應(yīng)對(duì)的一種挑戰(zhàn)。

與增加IT設(shè)備正常運(yùn)行時(shí)間一樣,提高數(shù)據(jù)中心網(wǎng)絡(luò)可靠性的策略,包括更好的網(wǎng)絡(luò)監(jiān)控和在網(wǎng)絡(luò)內(nèi)建立冗余,以便當(dāng)部分網(wǎng)絡(luò)出現(xiàn)故障時(shí),數(shù)據(jù)包可以選擇替代路由。

更多地使用軟件定義網(wǎng)絡(luò)也可以提高網(wǎng)絡(luò)可靠性,因?yàn)槭褂密浖刂贫皇俏锢砭W(wǎng)絡(luò)設(shè)備可以更容易地識(shí)別和減輕故障。

其他數(shù)據(jù)中心正常運(yùn)行時(shí)間挑戰(zhàn)

火災(zāi)和信息安全事件也在數(shù)據(jù)中心停機(jī)原因排名中占據(jù)重要位置,但只是勉強(qiáng)上榜。它們分別占所有中斷的3%和1%。

當(dāng)然,這并不是說不應(yīng)該投資防火措施和網(wǎng)絡(luò)安全保護(hù)。但如果想決定優(yōu)先考慮哪些類型的數(shù)據(jù)中心正常運(yùn)行風(fēng)險(xiǎn),數(shù)據(jù)表明這些不應(yīng)該是列表上的唯一操作。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2024-08-16
數(shù)據(jù)中心故障原因有哪些?
如果想增加數(shù)據(jù)中心的正常運(yùn)行時(shí)間,需要識(shí)別并緩解最常見的中斷源。這可能很有挑戰(zhàn)性,因?yàn)閿?shù)據(jù)中心可能出現(xiàn)故障的原因有很多,而且通常不可能解決每一個(gè)問題。相反,數(shù)據(jù)中心運(yùn)營商必須決定優(yōu)先考慮哪些正常運(yùn)行時(shí)間威脅。
Scan me!

長按掃碼 閱讀全文