深度解讀DevOps與AIOps如何應(yīng)對(duì)數(shù)字化時(shí)代新運(yùn)維

當(dāng)全世界都建構(gòu)在數(shù)字化技術(shù)之上,運(yùn)維的重要性攀上了前所未有的高峰。

隨著物聯(lián)網(wǎng)的發(fā)展,預(yù)計(jì)到2030年全球聯(lián)網(wǎng)設(shè)備數(shù)量將從80億增長到2000億,甚至更多,這些設(shè)備都是數(shù)字化設(shè)備,承載著難以計(jì)數(shù)的數(shù)字化服務(wù)。以此為基礎(chǔ),全世界都將事實(shí)性的構(gòu)建在數(shù)字化設(shè)備,或者說數(shù)字化技術(shù)之上。

但這些設(shè)備并非完美,鑒于這些數(shù)字化設(shè)備,都是由人遵循一定的模式創(chuàng)造出來的,缺陷與不足都會(huì)天然存在于這些數(shù)字化設(shè)備之中,這其中最著名的代表就是“千年蟲”——一個(gè)因?yàn)槿嗽赑C設(shè)備的時(shí)鐘設(shè)計(jì)時(shí)發(fā)生疏漏,產(chǎn)生波及面極廣的數(shù)字化海嘯的典型案例。

于是,對(duì)于數(shù)字化時(shí)代來說,針對(duì)數(shù)字化設(shè)備進(jìn)行運(yùn)維,確保其能夠安全可靠高速的運(yùn)轉(zhuǎn),在盡可能長的時(shí)間內(nèi)平穩(wěn)運(yùn)行,充分發(fā)揮其基本能力效用,成為一個(gè)關(guān)鍵議題,并直接影響到企業(yè)業(yè)務(wù)的收益和成本。

從某種意義上來說,運(yùn)維的重要性攀上前所未有的高峰是數(shù)字化時(shí)代的必然,但在運(yùn)維的重要性攀上前所未有高峰的同時(shí),傳統(tǒng)運(yùn)維方式和運(yùn)維技術(shù)迅速失效:

一方面,數(shù)字化時(shí)代運(yùn)維所要面對(duì)的數(shù)字化設(shè)備數(shù)量和復(fù)雜度都呈現(xiàn)出快速增長的趨勢(shì),運(yùn)維所要面對(duì)的問題更多、更復(fù)雜,運(yùn)維壓力也更大,傳統(tǒng)運(yùn)維無法消解壓力,只能將壓力直接傳遞給運(yùn)維團(tuán)隊(duì);

另一方面,企業(yè)在數(shù)字化時(shí)代的業(yè)務(wù)轉(zhuǎn)型和發(fā)展速度顯著加快,對(duì)數(shù)字化設(shè)備及時(shí)響應(yīng)能力的要求也更高,不僅如此,傳統(tǒng)運(yùn)維是以設(shè)備為導(dǎo)向而不是以數(shù)據(jù)為基礎(chǔ)、以業(yè)務(wù)需求為導(dǎo)向的,這意味著運(yùn)維與企業(yè)業(yè)務(wù)需求處在完全脫節(jié)的情形之下。

數(shù)字時(shí)代下,任何使用傳統(tǒng)運(yùn)維方式和運(yùn)維技術(shù)來管理機(jī)器數(shù)據(jù)的組織要么忽略了信息的價(jià)值,要么已經(jīng)讓他們的運(yùn)維團(tuán)隊(duì)不堪重負(fù)。

近年來,解決數(shù)字化時(shí)代運(yùn)維難題的思路逐漸聚焦:將開發(fā)和運(yùn)維這兩個(gè)領(lǐng)域相結(jié)合,通過自動(dòng)化“軟件交付”和“架構(gòu)變更”的流程,來使構(gòu)建、測(cè)試、發(fā)布軟件能夠更加地快捷、頻繁和可靠,直至逐漸形成開發(fā)與運(yùn)維緊密結(jié)合的自動(dòng)化運(yùn)維體系,這一體系更加強(qiáng)調(diào)從運(yùn)維流程、運(yùn)維手段等層面實(shí)現(xiàn)完全的自動(dòng)化,在特定情況下,甚至實(shí)現(xiàn)無人干預(yù)。

這就是當(dāng)前主流的DevOps,但對(duì)于正在選擇DevOps的傳統(tǒng)企業(yè)來說,卻并不是所有的DevOps都能夠適應(yīng)以及支持傳統(tǒng)企業(yè)向互聯(lián)網(wǎng)+轉(zhuǎn)型的進(jìn)程,與此同時(shí),DevOps的邊界也在隨著數(shù)字化時(shí)代的深入而不多擴(kuò)展。

傳統(tǒng)DevOps與互聯(lián)網(wǎng)DevOps有什么區(qū)別?從某種程度上來說,DevOps的概念誕生于互聯(lián)網(wǎng)行業(yè)。

在互聯(lián)網(wǎng)企業(yè)中,將開發(fā)與運(yùn)維結(jié)合的最大好處,是可以將開發(fā)和運(yùn)維部門整合為一體,實(shí)現(xiàn)產(chǎn)品開發(fā)、測(cè)試、上線的快速迭代,以應(yīng)對(duì)互聯(lián)網(wǎng)行業(yè)快速變化的趨勢(shì),不斷的快速滿足新興的客戶需求。

特別是在產(chǎn)品交付給運(yùn)維團(tuán)隊(duì)時(shí),由于在DevOps的過程中運(yùn)維團(tuán)隊(duì)有著深入?yún)⑴c,對(duì)產(chǎn)品的運(yùn)維建更有把握,可以在短期內(nèi)接手新產(chǎn)品的運(yùn)維工作。

但傳統(tǒng)企業(yè)在軟件發(fā)布模式和企業(yè)組織結(jié)構(gòu)上,與互聯(lián)網(wǎng)企業(yè)存在著較大的差別,即使近年來企業(yè)數(shù)字化轉(zhuǎn)型和“以互聯(lián)網(wǎng)思維優(yōu)化傳統(tǒng)企業(yè)”正在許多傳統(tǒng)企業(yè)中得到實(shí)踐,照搬互聯(lián)網(wǎng)企業(yè)的DevOps不是可取的解決方案,與此同時(shí),傳統(tǒng)企業(yè)軟件發(fā)布的模式面臨的挑戰(zhàn)也與互聯(lián)網(wǎng)企業(yè)不同,主要包括:

為保證產(chǎn)品質(zhì)量而設(shè)定的過長的開發(fā)測(cè)試流程與快速迭代交付的迫切業(yè)務(wù)需求之間的矛盾;

大量手工操作與企業(yè)對(duì)于產(chǎn)品質(zhì)量一致性、穩(wěn)定性嚴(yán)苛要求之間的矛盾;

開發(fā)團(tuán)隊(duì)對(duì)于流程簡單性、快速性的現(xiàn)實(shí)要求與風(fēng)險(xiǎn)管控之間的矛盾。

不僅如此,傳統(tǒng)企業(yè)對(duì)DevOps的核心訴求也并非是“開發(fā)與運(yùn)維的融合”:在傳統(tǒng)企業(yè)中,團(tuán)隊(duì)權(quán)責(zé)劃分有清晰地邊界,而并非融合型的跨職能型組織,因此DevOps所帶來的融合并非第一要?jiǎng)?wù),“創(chuàng)新”或者說是“借助DevOps實(shí)現(xiàn)業(yè)務(wù)上線流程的不斷演進(jìn)”,才是傳統(tǒng)企業(yè)的主要關(guān)注點(diǎn)。

因此,在技術(shù)上,傳統(tǒng)企業(yè)更希望借助DevOps整合現(xiàn)有工具平臺(tái),打通業(yè)務(wù)交付的端到端流水線;在架構(gòu)上,通過DevOps建構(gòu)融合效率與穩(wěn)定需求的精益管理;在流程上,實(shí)現(xiàn)人員架構(gòu)與業(yè)務(wù)發(fā)布標(biāo)準(zhǔn)流程的不斷優(yōu)化。

基于以上對(duì)傳統(tǒng)企業(yè)DevOps的深入認(rèn)知,睿至大數(shù)據(jù)建立了一整套面向傳統(tǒng)企業(yè)的DevOps落地規(guī)劃,其中明確指出:應(yīng)當(dāng)在傳統(tǒng)企業(yè)中構(gòu)建端到端的DevOps能力,通過DevOps中各類角色的能力融合、能力傳遞,減少流程環(huán)節(jié)的浪費(fèi),幫助傳統(tǒng)企業(yè)提高效率。具體來說,睿至大數(shù)據(jù)在傳統(tǒng)企業(yè)中構(gòu)建DevOps遵循三條需求定律:

該平臺(tái)一定要與企業(yè)目前所具備的基礎(chǔ)設(shè)施相結(jié)合,而不能像一些初創(chuàng)企業(yè),馬上就對(duì)整個(gè)基礎(chǔ)環(huán)境及設(shè)施進(jìn)行更新;

該平臺(tái)一定要考慮到企業(yè) IT 組織目前的組織結(jié)構(gòu)現(xiàn)狀、人才技能現(xiàn)狀以及存量產(chǎn)品特點(diǎn);

該平臺(tái)一定要與企業(yè)目前已有的流程控制系統(tǒng)相結(jié)合,而不能獨(dú)立于現(xiàn)有的流程控制系統(tǒng)。

在這樣的DevOps平臺(tái)構(gòu)建思路下,睿至大數(shù)據(jù)將幫助傳統(tǒng)企業(yè)構(gòu)建DevOps流水線工具平臺(tái)層:該工具平臺(tái)對(duì)上通過流水線引擎與現(xiàn)有的流程管理系統(tǒng)對(duì)接,對(duì)中整合現(xiàn)有的各種開發(fā)測(cè)試部署工具,對(duì)下則采集并分析存量硬件和云平臺(tái)的基礎(chǔ)設(shè)施監(jiān)控?cái)?shù)據(jù)并分析反饋。同時(shí),睿至大數(shù)據(jù)還為傳統(tǒng)企業(yè)提供統(tǒng)一資源管理平臺(tái)基礎(chǔ)。

睿至大數(shù)據(jù)為傳統(tǒng)企業(yè)建立的DevOps流水線工具平臺(tái),既可以幫助傳統(tǒng)企業(yè)建立持續(xù)的集成體系,實(shí)現(xiàn)交付過程的標(biāo)準(zhǔn)化與透明化,也可以透明化應(yīng)用交易過程,實(shí)現(xiàn)端到端的應(yīng)用性能管理,同時(shí),以此為基礎(chǔ)企業(yè)能夠構(gòu)建起立體化監(jiān)控體系,實(shí)現(xiàn)運(yùn)行狀態(tài)的可視化及深度性能分析,或幫助傳統(tǒng)企業(yè)整合利用現(xiàn)有運(yùn)維數(shù)據(jù),進(jìn)行運(yùn)維大數(shù)據(jù)分析。

睿至大數(shù)據(jù)認(rèn)為:目前傳統(tǒng)企業(yè)所面臨的挑戰(zhàn)既有技術(shù)層面上的,也有開發(fā)模式以及流程管理上的,試圖采用單一的方法進(jìn)行應(yīng)對(duì)無法奏效,也無法一蹴而就進(jìn)行解決。

因此,在幫助企業(yè)客戶構(gòu)建DevOps時(shí),睿至大數(shù)據(jù)制定了詳細(xì)的適合企業(yè)自身的落地路線圖,分為“技術(shù)改造-架構(gòu)優(yōu)化-流程優(yōu)化”三大階段,不僅幫助企業(yè)客戶消除大量的手工操作,構(gòu)建持續(xù)交付的流水線平臺(tái),而且能夠?qū)鹘y(tǒng)企業(yè)的開發(fā)模式、產(chǎn)品架構(gòu)乃至整體開發(fā)測(cè)試發(fā)布流程實(shí)現(xiàn)優(yōu)化。

但DevOps還不是“終局”,自動(dòng)化運(yùn)維確實(shí)帶來了很大的進(jìn)步,但是它只能100%的按照人類制定的指令和流程運(yùn)行,無法自主適應(yīng),甚至不能處理與舊問題非常相似的“新問題”,這就需要將以人工智能為代表的新一代信息技術(shù)運(yùn)用到運(yùn)維這一領(lǐng)域,在以數(shù)據(jù)化為導(dǎo)向、自動(dòng)化為基礎(chǔ),結(jié)合AI實(shí)現(xiàn)運(yùn)維的智能化,這就是最近一段時(shí)間火熱的AIOps。

現(xiàn)階段AIOps的發(fā)展:重在落地

據(jù)Gartner預(yù)測(cè),至2020年,將近50%的企業(yè)會(huì)在業(yè)務(wù)和IT運(yùn)維方面采用AIOps,這一比例遠(yuǎn)遠(yuǎn)高于今天的10%,AIOps將會(huì)在未來2、3年中進(jìn)入高速發(fā)展階段。

就概念來說,AIOps并不是一個(gè)全新的概念,而是IT運(yùn)營分析和管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物。

AIOps智能運(yùn)維以ITOA/ITOM系統(tǒng)所采集的運(yùn)維大數(shù)據(jù)為基礎(chǔ),利用人工智能和機(jī)器學(xué)習(xí)算法對(duì)運(yùn)維數(shù)據(jù)進(jìn)行深入分析,涵蓋IT監(jiān)控,應(yīng)用性能管理、外網(wǎng)監(jiān)控、日志分析,系統(tǒng)安全等方面。

就能力而言,AIOps智能運(yùn)維平臺(tái)能夠接入不同業(yè)務(wù)系統(tǒng)、監(jiān)控系統(tǒng)、管理系統(tǒng)的海量IT數(shù)據(jù),并運(yùn)用各種算法進(jìn)行高速分析、學(xué)習(xí)甚至預(yù)測(cè)。

立足于AIOps,IT部門可以獲得強(qiáng)大的自動(dòng)化IT決策和運(yùn)營管理能力,并能對(duì)業(yè)務(wù)質(zhì)量和用戶體驗(yàn)進(jìn)行準(zhǔn)確檢測(cè)和持續(xù)優(yōu)化。

但理想與現(xiàn)實(shí)之間往往存在著一定的差距,目前階段的AIOps可以理解為:通過深度整合IT數(shù)據(jù)資源與運(yùn)維的實(shí)際場(chǎng)景進(jìn)行深度集成的,同時(shí)結(jié)合了大數(shù)據(jù)以及機(jī)器學(xué)習(xí)技術(shù),以多種維度和分析場(chǎng)景為展現(xiàn)的智能輔助分析平臺(tái)。

當(dāng)前階段的AIOps平臺(tái)主要適用于中大型客戶,并需要構(gòu)建者在行業(yè)領(lǐng)域相關(guān)知識(shí)、對(duì)應(yīng)行業(yè)運(yùn)維場(chǎng)景知識(shí)和機(jī)器學(xué)習(xí)相關(guān)知識(shí)上具有一定的儲(chǔ)備。

睿至大數(shù)據(jù)基于上述對(duì)AIOps現(xiàn)階段情況的理解,設(shè)計(jì)并構(gòu)建了睿至大數(shù)據(jù)AIOps平臺(tái)整體方案。

睿至大數(shù)據(jù)AIOps平臺(tái)整體方案以對(duì)國內(nèi)外各種數(shù)據(jù)源標(biāo)準(zhǔn)化支持為基礎(chǔ),構(gòu)建包括運(yùn)維知識(shí)圖譜、實(shí)時(shí)分析庫、短期匯總庫和長期匯總庫在內(nèi)的數(shù)據(jù)匯聚層,同時(shí)借助機(jī)器學(xué)習(xí)算法為智能運(yùn)維門戶提供在不同場(chǎng)景下的落地功能,在故障準(zhǔn)確定位、系統(tǒng)隱患發(fā)現(xiàn)、趨勢(shì)預(yù)測(cè)分析以及業(yè)務(wù)創(chuàng)新分析方面具有較強(qiáng)的競爭實(shí)力,睿至大數(shù)據(jù)將企業(yè)AIOps的建設(shè)階段分為四個(gè):

第一階段是數(shù)據(jù)治理、標(biāo)準(zhǔn)化以及統(tǒng)一存儲(chǔ);

第二階段是可視化界面和多維度統(tǒng)計(jì)分析;

第三階段是對(duì)接算法和模型,進(jìn)行簡單的異常診斷;

第四階段則進(jìn)如深度集成多種算法和機(jī)器學(xué)習(xí)結(jié)果,以統(tǒng)一場(chǎng)景進(jìn)行分析和展現(xiàn)的階段。

在每個(gè)階段中,睿至大數(shù)據(jù)AIOps的建設(shè)核心都是“落地”。比如說在數(shù)據(jù)治理、標(biāo)準(zhǔn)化以及統(tǒng)一存儲(chǔ)的第一階段,睿至大數(shù)據(jù)AIOps在建設(shè)過程中明確提出兩個(gè)盡早明確:

數(shù)據(jù)抽取范圍和對(duì)應(yīng)數(shù)據(jù)的抽取方案盡早明確;

各類數(shù)據(jù)抽取到平臺(tái)的數(shù)據(jù)標(biāo)準(zhǔn)格式要盡早明確。

結(jié)合考慮后續(xù)應(yīng)用場(chǎng)景的數(shù)據(jù)存儲(chǔ)服務(wù),在第一階段完成后,企業(yè)客戶切切實(shí)實(shí)的能夠?qū)崿F(xiàn)基礎(chǔ)的數(shù)據(jù)治理、標(biāo)準(zhǔn)化和統(tǒng)一存儲(chǔ)架構(gòu)。

完成睿至大數(shù)據(jù)AIOps的構(gòu)建,企業(yè)客戶可以實(shí)現(xiàn)基于機(jī)器學(xué)習(xí)的多指標(biāo)關(guān)聯(lián)分析,并構(gòu)建基于業(yè)務(wù)拓?fù)涞母櫼晥D以及業(yè)務(wù)畫像和故障診斷視圖,相比傳統(tǒng)運(yùn)維,分析和展現(xiàn)的結(jié)果對(duì)現(xiàn)實(shí)運(yùn)維更有輔助指導(dǎo)意義,并且為實(shí)現(xiàn)理想中的AIOps智能化運(yùn)維打下良好的基礎(chǔ)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-09-19
深度解讀DevOps與AIOps如何應(yīng)對(duì)數(shù)字化時(shí)代新運(yùn)維
當(dāng)全世界都建構(gòu)在數(shù)字化技術(shù)之上,運(yùn)維的重要性攀上了前所未有的高峰。

長按掃碼 閱讀全文