全年盤點(diǎn):2017年國(guó)外的10大云故障

隨著云應(yīng)用的愈發(fā)成熟,云計(jì)算提供商也開發(fā)出了更好的維護(hù)工具來運(yùn)營(yíng)最大的、最先進(jìn)的服務(wù)器集群,因此,災(zāi)難性的云計(jì)算故障在2017年似乎是一個(gè)不合時(shí)宜的事了。雖然所有廠商都遭遇了可能會(huì)限制特定服務(wù)的宕機(jī)時(shí)間,或者局部不可用的短時(shí)間故障,但是很多人認(rèn)為,在早期出現(xiàn)的那種大規(guī)模故障,肯定是原始時(shí)代的事情了。

但是接近2月底的時(shí)候,AWS的故障事件就震動(dòng)了整個(gè)行業(yè),打擊了企業(yè)客戶對(duì)采用云計(jì)算的信心,因?yàn)楣收袭?dāng)天有數(shù)量龐大的業(yè)務(wù)受到影響,GitHub、Slack、Zendesk、Heroku、Twilio、Mailchimp、Citrix和Expedia,只是其中的一小部分。當(dāng)AWS透露這次故障是由人為錯(cuò)誤導(dǎo)致,人們的信心進(jìn)一步降低——實(shí)際上是由于技術(shù)人員輸入不正確的單行命令導(dǎo)致。

下面是盤點(diǎn)出的2017年國(guó)外10大云故障,提醒人們,這個(gè)快速成熟的行業(yè),其出色運(yùn)營(yíng)的風(fēng)險(xiǎn)比以往任何時(shí)候都要高。

全年盤點(diǎn):2017年國(guó)外的10大云故障

IBM,1月26日

全年盤點(diǎn):2017年國(guó)外的10大云故障

今年年初,IBM云的可信度受到打擊,當(dāng)時(shí)客戶用于訪問Bluemix云基礎(chǔ)設(shè)施的一個(gè)管理門戶出現(xiàn)數(shù)小時(shí)的故障。

雖然底層基礎(chǔ)設(shè)施沒有發(fā)生故障,但是客戶沮喪地發(fā)現(xiàn),他們無法管理他們的應(yīng)用、無法添加或者移除為工作負(fù)載提供支持的云資源。

IBM表示,這次故障是間歇性的,是由接口的錯(cuò)誤更新導(dǎo)致。

GitLab,1月31日

全年盤點(diǎn):2017年國(guó)外的10大云故障

GitLab廣受歡迎的在線代碼庫GitLab.com遭遇了18個(gè)小時(shí)的服務(wù)中斷,最終還是沒有完全修復(fù)。這次故障主要原因是,一位員工在維護(hù)流程中將一個(gè)數(shù)據(jù)庫目錄從錯(cuò)誤的數(shù)據(jù)庫服務(wù)器中刪除導(dǎo)致的。

GitLab事后表示,最樂觀的估計(jì)是,這次故障影響了大約5000個(gè)項(xiàng)目、5000條評(píng)論和700個(gè)新用戶帳戶。

Facebook,2月2日

全年盤點(diǎn):2017年國(guó)外的10大云故障

在漫長(zhǎng)而痛苦的三個(gè)小時(shí)中,全球各地的一些用戶被鎖在Facebook之外,擔(dān)心他們的帳戶被黑客入侵。

社交媒體巨頭Facebook隨后解釋說,有功能將會(huì)防范黑客發(fā)送給用戶一個(gè)恢復(fù)屏幕,讓人感覺有人登錄了他們的帳戶,受影響的用戶會(huì)被阻止立即重新登錄。

Facebook確認(rèn)實(shí)際上并沒有發(fā)生安全漏洞。這是Facebook第二次出現(xiàn)故障。幾天之前,有人報(bào)告說他們看不到他們的新聞消息。

AWS,2月28日

全年盤點(diǎn):2017年國(guó)外的10大云故障

這是一次震動(dòng)整個(gè)業(yè)界的故障事件。一位AWS工程師試圖對(duì)位于弗吉尼亞州數(shù)據(jù)中心內(nèi)的一個(gè)S3存儲(chǔ)系統(tǒng)進(jìn)行調(diào)試的時(shí)候,意外地輸入了一個(gè)錯(cuò)誤命令行,隨后大部分互聯(lián)網(wǎng),包括Slack、Quora和Trello在內(nèi)的很多企業(yè)平臺(tái)停機(jī)了4個(gè)小時(shí)。

調(diào)查顯示,該員工使用既定的步驟,試圖關(guān)閉少量托管了計(jì)費(fèi)流程子系統(tǒng)的服務(wù)器。相反,意外的命令導(dǎo)致更大范圍服務(wù)器處于脫機(jī)狀態(tài),其中包括為服務(wù)器提供特定數(shù)據(jù)存儲(chǔ)所需的一個(gè)子系統(tǒng),以及另一個(gè)分配新存儲(chǔ)的子系統(tǒng)。

這次由這樣一家?guī)缀跽紦?jù)了全球1/3云市場(chǎng)份額的提供商導(dǎo)致的故障,重新引發(fā)了關(guān)于公有云風(fēng)險(xiǎn)的爭(zhēng)論。

微軟,3月16日

全年盤點(diǎn):2017年國(guó)外的10大云故障

存儲(chǔ)可用性問題困擾了微軟Azure公有云超過8個(gè)小時(shí),主要影響到美國(guó)東部的一些客戶。一些用戶無法配置新存儲(chǔ)或者訪問該地區(qū)的現(xiàn)有資源。隨后一個(gè)微軟工程團(tuán)隊(duì)將這次故障歸咎于一個(gè)存儲(chǔ)集群端點(diǎn)并出現(xiàn)不可用的情況。

除了該問題之外,微軟還在Azure狀態(tài)頁面上列出了一個(gè)軟件錯(cuò)誤,使得多個(gè)服務(wù)的存儲(chǔ)配置受影響超過1個(gè)小時(shí)。

微軟Office 365,3月21日

全年盤點(diǎn):2017年國(guó)外的10大云故障

由于用戶身份驗(yàn)證問題,導(dǎo)致多個(gè)微軟企業(yè)和消費(fèi)級(jí)云服務(wù)(包括Office 365存儲(chǔ)和電子郵件服務(wù))無法使用。

這次受影響廣泛的故障使得客戶無法訪問OneDrive存儲(chǔ)、Skype協(xié)作、Outlook電子郵件、以及像Xbox Live這樣的消費(fèi)級(jí)產(chǎn)品。

蘋果iCloud,6月28日

全年盤點(diǎn):2017年國(guó)外的10大云故障

有多個(gè)社交媒體來源報(bào)道稱,蘋果iCloud Backup服務(wù)出現(xiàn)了可用性故障。平臺(tái)的系統(tǒng)狀態(tài)頁面顯示,iCloud Backup只影響了不到1%的用戶。

在這次故障中,受影響的用戶無法從之前的備份中恢復(fù)iOS設(shè)備,持續(xù)了至少36小時(shí)。雖然恢復(fù)過程會(huì)被掛起無法完成,但是啟動(dòng)新的設(shè)備備份以保護(hù)數(shù)據(jù)是沒有問題的。

AWS,9月14日

全年盤點(diǎn):2017年國(guó)外的10大云故障

雖然9月份發(fā)生的這起AWS服務(wù)遠(yuǎn)不如2月份的那么嚴(yán)重,但事實(shí)上這次故障影響了S3存儲(chǔ)服務(wù),且源自于同一個(gè)US-EAST-1地區(qū),足以引起人們對(duì)半年前災(zāi)難性事件的不愉快回憶。

訪問存儲(chǔ)塊出現(xiàn)問題,從當(dāng)天中午開始引起人們的注意,并在東部時(shí)間下午1點(diǎn)前得到控制。

微軟Azure,9月29日

全年盤點(diǎn):2017年國(guó)外的10大云故障

當(dāng)天歐洲的客戶無法使用微軟Azure公有云中的一些服務(wù)長(zhǎng)達(dá)7個(gè)小時(shí)。這次讓北歐第二大云計(jì)算提供商出現(xiàn)故障的原因是意外啟動(dòng)了滅火系統(tǒng)。微軟表示,對(duì)系統(tǒng)的日常維護(hù)工作導(dǎo)致滅火氣體釋放,自動(dòng)出發(fā)空調(diào)系統(tǒng)關(guān)閉,從而讓設(shè)備溫度升高,迫使計(jì)算機(jī)系統(tǒng)自動(dòng)關(guān)閉。

像Virtual Machines、Cloud Services、Azure Backup等多個(gè)重要服務(wù)都在本地時(shí)間下午1:27到8:15處于脫機(jī)狀態(tài)。

Google Docs,11月15日

全年盤點(diǎn):2017年國(guó)外的10大云故障

有數(shù)千位Google Docs用戶遭遇了服務(wù)中斷,導(dǎo)致他們的業(yè)務(wù)受到影響。

這次停機(jī)是從東部時(shí)間下午4點(diǎn)之前開始的,持續(xù)了30分鐘到1個(gè)小時(shí)的時(shí)間。Google證實(shí),這次故障影響了一個(gè)“重要用戶子集”,備受歡迎的文檔創(chuàng)建和編輯工具也無法訪問文件。

Google表示,在周三晚上對(duì)于大多數(shù)用戶來說Google Docs服務(wù)已經(jīng)恢復(fù)。

Google的一家合作伙伴表示,在其400家企業(yè)客戶中,有6家受到這次故障的影響。這家解決方案提供商,同時(shí)也是Google用戶,本身也受到了影響。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-12-25
全年盤點(diǎn):2017年國(guó)外的10大云故障
下面是盤點(diǎn)出的2017年國(guó)外10大云故障,提醒人們,這個(gè)快速成熟的行業(yè),其出色運(yùn)營(yíng)的風(fēng)險(xiǎn)比以往任何時(shí)候都要高。

長(zhǎng)按掃碼 閱讀全文