拒絕成為空中樓閣,智能運(yùn)維為災(zāi)備建設(shè)打開(kāi)新思路

2010年,筆者有幸現(xiàn)場(chǎng)觀摩了西部某區(qū)域性銀行的容災(zāi)演練:“數(shù)據(jù)庫(kù)系統(tǒng)癱瘓”和“數(shù)據(jù)中心發(fā)生火災(zāi)”兩個(gè)場(chǎng)景演練全部在真實(shí)生產(chǎn)環(huán)境進(jìn)行,演練時(shí)間加起來(lái)不過(guò)10分鐘,恢復(fù)速度讓包括筆者在內(nèi)的現(xiàn)場(chǎng)人員驚嘆不已。然而,更讓筆者震驚的是2014年銀監(jiān)會(huì)的通告,該行應(yīng)急恢復(fù)處置機(jī)制嚴(yán)重缺失,導(dǎo)致系統(tǒng)恢復(fù)工作進(jìn)展緩慢,業(yè)務(wù)系統(tǒng)中斷長(zhǎng)達(dá)37小時(shí)40分鐘,其間完全依靠手工辦理業(yè)務(wù)。

這件事情促使筆者曾經(jīng)思考過(guò):哪怕企業(yè)的災(zāi)備體系建設(shè)完備、日常演練流暢,但企業(yè)真正的災(zāi)難恢復(fù)能力到底如何?企業(yè)又該如何評(píng)估自身的災(zāi)難恢復(fù)能力?

如何讓企業(yè)的災(zāi)備系統(tǒng)不成為一種擺設(shè),做到災(zāi)備建設(shè)心中有一桿秤?這是業(yè)界一直困擾和渴望解決的。如今,愛(ài)數(shù)提供了一種新思路,在業(yè)界率先將智能運(yùn)維能力融入到災(zāi)備體系之中,為企業(yè)構(gòu)建可見(jiàn)的可恢復(fù)能力打開(kāi)了新局面。

災(zāi)備不應(yīng)成為空中樓閣

過(guò)去幾年里,類(lèi)似該區(qū)域性銀行的案例不在少數(shù),空有災(zāi)備體系,面對(duì)災(zāi)難/事故卻無(wú)能為力。

歸根結(jié)底,業(yè)務(wù)變化所帶來(lái)的復(fù)雜性與相對(duì)穩(wěn)固的災(zāi)備體系逐漸不匹配。一方面,各行各業(yè)數(shù)字化轉(zhuǎn)型和智能化升級(jí),帶來(lái)的是業(yè)務(wù)場(chǎng)景數(shù)量、形態(tài)都在發(fā)生急速變化,以一個(gè)股份制銀行為例,其業(yè)務(wù)場(chǎng)景如今就超過(guò)300多個(gè),類(lèi)似因?yàn)橐咔槎d起的云柜員場(chǎng)景,也在銀行中迅速普及,新業(yè)務(wù)場(chǎng)景的井噴,帶來(lái)著數(shù)據(jù)量激增和數(shù)據(jù)類(lèi)型更加豐富,也意味著帶來(lái)了新的災(zāi)備需求。

另一方面,企業(yè)的災(zāi)備體系一旦建立,往往是相對(duì)固定的,雖然也會(huì)有日常的一些演練,但是相比于動(dòng)態(tài)快速變化的業(yè)務(wù)場(chǎng)景,已經(jīng)建成的災(zāi)備體系乃至災(zāi)備思維卻愈發(fā)難適應(yīng)這種變化,企業(yè)災(zāi)備體系并不知道未來(lái)備份存儲(chǔ)容量應(yīng)該如何規(guī)劃,也不知道災(zāi)備系統(tǒng)運(yùn)行狀態(tài)如何,更不知道新增任務(wù)最合適的策略和恢復(fù)風(fēng)險(xiǎn)評(píng)估。

過(guò)去,這些工作往往依賴于資深的災(zāi)備專(zhuān)家來(lái)完成。但顯然,業(yè)務(wù)的快速變化以及專(zhuān)家資源的稀缺,使得大部分企業(yè)都面臨著如何建立有效災(zāi)難恢復(fù)能力的挑戰(zhàn)。愛(ài)數(shù)資深災(zāi)備專(zhuān)家常華直言,投入巨資的災(zāi)備建設(shè),其核心訴求應(yīng)該是災(zāi)難恢復(fù)能力,當(dāng)前大部分企業(yè)都面臨著災(zāi)備資源可監(jiān)控但無(wú)法預(yù)測(cè),災(zāi)備恢復(fù)能力水平難以評(píng)估、可恢復(fù)能力不可見(jiàn)等典型痛點(diǎn)。

而解決這些痛點(diǎn)的思路,就是將智能運(yùn)維的理念、技術(shù)、方案引入到災(zāi)備體系之中,讓災(zāi)備恢復(fù)能力的指標(biāo)體系化,災(zāi)備運(yùn)營(yíng)更加智能化和可視化,徹底告別過(guò)去華而不實(shí)的“空中樓閣”建設(shè)現(xiàn)象。

智能運(yùn)維為災(zāi)備打開(kāi)新思路

智能運(yùn)維的理念如今深深影響到數(shù)據(jù)中心的方方面面。

同樣,把智能運(yùn)維的理念、技術(shù)和方案納入到災(zāi)備體系是否可行?愛(ài)數(shù)首先在業(yè)界做了嘗試,將AnyRobot與AnyBackup進(jìn)行緊密集成,為災(zāi)備體系融入了智能運(yùn)維能力。AnyRobot是愛(ài)數(shù)開(kāi)放、高效、經(jīng)濟(jì)的機(jī)器數(shù)據(jù)分析平臺(tái),其目的是在海量機(jī)器數(shù)據(jù)中挖掘出價(jià)值。

首先,愛(ài)數(shù)基于多年面向大型客戶災(zāi)備建設(shè)的經(jīng)驗(yàn)和積累的方案,對(duì)災(zāi)備體系中管理者、運(yùn)維團(tuán)隊(duì)、審計(jì)人員等不同角色需求進(jìn)行調(diào)研,了解不同角色的需求。愛(ài)數(shù)技術(shù)專(zhuān)家表示,高層管理者更加關(guān)注數(shù)據(jù)是否可用、災(zāi)備體系的建設(shè)成效如何,而運(yùn)維團(tuán)隊(duì)則更加關(guān)注備份、容災(zāi)的一些具體的操作、狀態(tài)和指標(biāo),愛(ài)數(shù)的AnyRobot增強(qiáng)災(zāi)難恢復(fù)解決方案基于這些需求基礎(chǔ)上進(jìn)行設(shè)計(jì)。

之后,針對(duì)愛(ài)數(shù)AnyBackup災(zāi)備環(huán)境,聚焦災(zāi)備恢復(fù)能力三個(gè)重要方面:災(zāi)備系統(tǒng)可用、災(zāi)備資源可用和可恢復(fù)能力,愛(ài)數(shù)進(jìn)行詳細(xì)的分析。例如,針對(duì)災(zāi)難恢復(fù)演練的分析,就極具價(jià)值,可以根據(jù)災(zāi)難恢復(fù)演練情況來(lái)分析企業(yè)相應(yīng)的可恢復(fù)能力。

此外,愛(ài)數(shù)對(duì)災(zāi)備執(zhí)行過(guò)程合規(guī)和災(zāi)備體系建設(shè)成效可視化兩個(gè)能力進(jìn)行增強(qiáng),讓災(zāi)備體系建設(shè)更加完善。愛(ài)數(shù)技術(shù)專(zhuān)家介紹,像災(zāi)備執(zhí)行過(guò)程所有任務(wù)、管理員操作過(guò)程是否合規(guī),將有助于進(jìn)一步提升災(zāi)難恢復(fù)能力。

在這些基礎(chǔ)上,愛(ài)數(shù)對(duì)于AnyBackup環(huán)境下災(zāi)備體系進(jìn)行指標(biāo)明細(xì)化,然后通過(guò)全面分析來(lái)幫助用戶增強(qiáng)系統(tǒng)災(zāi)難恢復(fù)能力。

AnyRobot讓災(zāi)備恢復(fù)能力可見(jiàn)

具體來(lái)看,愛(ài)數(shù)AnyRobot智能運(yùn)維災(zāi)備解決方案從五個(gè)方面來(lái)徹底提升災(zāi)備恢復(fù)能力:

其一、實(shí)現(xiàn)了全面的基礎(chǔ)設(shè)施監(jiān)控,保障備份系統(tǒng)可用,包括CPU使用率、磁盤(pán)空間、讀寫(xiě)狀態(tài)等,可以全面、及時(shí)了解備份系統(tǒng)各種資源的基本情況。

其二、實(shí)現(xiàn)對(duì)備份的存儲(chǔ)容量智能預(yù)測(cè),避免資源儲(chǔ)備不足,例如云存儲(chǔ)、磁帶、磁盤(pán)等,基于當(dāng)前備份數(shù)據(jù)增長(zhǎng)情況和剩余容量情況,管理員可以根據(jù)指標(biāo)情況進(jìn)行相應(yīng)操作。

其三、實(shí)現(xiàn)備份任務(wù)監(jiān)控分析,有效評(píng)估災(zāi)難恢復(fù)的風(fēng)險(xiǎn),對(duì)比歷史備份任務(wù)指標(biāo)和可用備份資源,給出新建備份任務(wù)窗口、數(shù)據(jù)恢復(fù)風(fēng)險(xiǎn)評(píng)估等建議。眾所周知,備份容災(zāi)任務(wù)一旦增多,在成百上千個(gè)任務(wù)中發(fā)現(xiàn)問(wèn)題對(duì)于管理員是個(gè)極大挑戰(zhàn),而通過(guò)智能手段來(lái)洞察備份中的異常,及時(shí)給出建議,將極大提升災(zāi)備恢復(fù)能力。

其四、對(duì)備份系統(tǒng)的管理員操作行為審計(jì),確保備份數(shù)據(jù)安全。像對(duì)備份系統(tǒng)用戶登錄監(jiān)控、備份系統(tǒng)執(zhí)行操作命令監(jiān)控,及時(shí)了解操作情況和不合規(guī)情況。

其五、災(zāi)備體系監(jiān)控大屏,積累多個(gè)行業(yè)大屏模板,形成災(zāi)備運(yùn)營(yíng)的可視化。這其中,愛(ài)數(shù)與國(guó)內(nèi)領(lǐng)先的大數(shù)據(jù)BI廠商帆軟合作,共同為用戶構(gòu)建災(zāi)備運(yùn)營(yíng)的可視化,讓用戶對(duì)于災(zāi)備體系狀態(tài)一目了然。

總體來(lái)看,產(chǎn)業(yè)數(shù)字化和企業(yè)數(shù)字化轉(zhuǎn)型在不斷走向深入,業(yè)務(wù)連續(xù)性的重要性也日益突出,如何確保業(yè)務(wù)連續(xù)、提升用戶體驗(yàn),災(zāi)備體系的作用不可低估。面對(duì)數(shù)字化帶來(lái)的新場(chǎng)景、新需求、新痛點(diǎn),必須要有新思路、新手段、新方案來(lái)解決,而愛(ài)數(shù)將AnyBackup與AnyRobot緊密集成,的確是提供了一種新思路,為用戶災(zāi)備恢復(fù)能力可見(jiàn)打開(kāi)了新局面。面向未來(lái),愛(ài)數(shù)的這種理念必然將惠及到更多行業(yè)用戶之中,其解決方案有望發(fā)揮更大價(jià)值。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2021-08-19
拒絕成為空中樓閣,智能運(yùn)維為災(zāi)備建設(shè)打開(kāi)新思路
愛(ài)數(shù)技術(shù)專(zhuān)家表示,高層管理者更加關(guān)注數(shù)據(jù)是否可用、災(zāi)備體系的建設(shè)成效如何,而運(yùn)維團(tuán)隊(duì)則更加關(guān)注備份、容災(zāi)的一些具體的操作、狀態(tài)和指標(biāo),愛(ài)數(shù)的AnyRobot增強(qiáng)災(zāi)難恢復(fù)解決方案基于這些需求基礎(chǔ)上進(jìn)行設(shè)

長(zhǎng)按掃碼 閱讀全文