2018年,AIOps智能運(yùn)維儼然成為中國(guó)運(yùn)維市場(chǎng)的風(fēng)口。在這一年里,傳統(tǒng)ITOM/ITSM廠商、新興APM/NPM廠商、各大云廠商紛紛轉(zhuǎn)戰(zhàn)智能運(yùn)維,描繪出種種智能運(yùn)維發(fā)展藍(lán)圖和未來(lái)產(chǎn)品。而在各種運(yùn)維大會(huì)上,智能運(yùn)維也成了焦點(diǎn)話題,專家學(xué)者們不斷向業(yè)界灌輸智能運(yùn)維的好處,似乎有了智能運(yùn)維就能立刻破解伴隨數(shù)字化轉(zhuǎn)型而來(lái)的IT規(guī)模和復(fù)雜度暴增的管理難題,甚至能逐步取代運(yùn)維人員,實(shí)現(xiàn)NoOps無(wú)人化運(yùn)維。
智能運(yùn)維到底有沒(méi)有這么神奇?什么才是真正的AIOps智能運(yùn)維?AIOps智能運(yùn)維到底能給企業(yè)帶來(lái)哪些能力?本文將為您逐一解讀。
什么是AIOps智能運(yùn)維
早在2016年之前,著名IT研究機(jī)構(gòu)Gartner在其詞庫(kù)就添加了AIOps這一詞條,彼時(shí)AIOps是Algorithmic IT Operations的縮寫(xiě),按照字面理解,AIOps是一種基于算法的運(yùn)維方式。時(shí)至今日,仍有互聯(lián)網(wǎng)大廠和算法界專家把Algorithmic算法作為AIOps智能運(yùn)維的核心價(jià)值。
清華大學(xué)裴丹教授對(duì)AIOps的定義是:AIOps將人工智能應(yīng)用于運(yùn)維領(lǐng)域,基于已有的運(yùn)維數(shù)據(jù)(日志、監(jiān)控信息、應(yīng)用信息等),通過(guò)機(jī)器學(xué)習(xí)的方式來(lái)進(jìn)一步解決自動(dòng)化運(yùn)維沒(méi)辦法解決的問(wèn)題。AIOps 不依賴于人為指定規(guī)則,主張由機(jī)器學(xué)習(xí)算法自動(dòng)地從海量運(yùn)維數(shù)據(jù)中不斷地學(xué)習(xí),不斷地提煉并總結(jié)規(guī)則。
然而,經(jīng)過(guò)近3年全球AIOps市場(chǎng)的發(fā)展和沉淀, Gartner在2018年11月發(fā)布的最新版《Market Guide for AIOps Platforms》報(bào)告中把AIOps的含義由算法升級(jí)為智能,即Artificial Intelligence for IT Operations,并為AIOps平臺(tái)作出如下定義:“整合大數(shù)據(jù)和機(jī)器學(xué)習(xí)能力,通過(guò)松耦合、可擴(kuò)展方式去提取和分析在數(shù)據(jù)量(volume)、種類(variety)和速度(velocity)這三個(gè)維度不斷增長(zhǎng)的IT數(shù)據(jù),為所有主流ITOM產(chǎn)品提供支撐。AIOps平臺(tái)夠同時(shí)使用多個(gè)數(shù)據(jù)源、數(shù)據(jù)采集方法及分析和展現(xiàn)技術(shù),廣泛增強(qiáng)IT運(yùn)維流程和事件管理效率,可用于性能分析,異常檢測(cè),事件關(guān)聯(lián)分析,ITSM和自動(dòng)化等應(yīng)用場(chǎng)景。”
IT行業(yè)的領(lǐng)頭羊IBM在《金融行業(yè)智能運(yùn)維實(shí)施建議白皮書(shū)》開(kāi)篇明義:“AIOps就是希望通過(guò)人工智能的方式,對(duì)系統(tǒng)運(yùn)行過(guò)程中所產(chǎn)生的數(shù)據(jù),運(yùn)用AI和算法、運(yùn)籌理論等相關(guān)技術(shù),對(duì)運(yùn)維數(shù)據(jù)進(jìn)行分析,進(jìn)一步提升運(yùn)維效率,包括運(yùn)維決策、故障預(yù)測(cè)和問(wèn)題分析等的新一代運(yùn)維手段和方法。”
國(guó)內(nèi)智能運(yùn)維的創(chuàng)新公司云智慧,通過(guò)3年的探索和實(shí)踐,率先實(shí)現(xiàn)了AIOps的產(chǎn)品化和場(chǎng)景化。云智慧CEO殷晉對(duì)AIOps的理解更加貼合中國(guó)市場(chǎng)和數(shù)字化轉(zhuǎn)型企業(yè)的需求:“AIOps與其說(shuō)是產(chǎn)品,不如說(shuō)是一種理念和策略。通過(guò)以數(shù)據(jù)為基礎(chǔ)、算法為支撐,場(chǎng)景為導(dǎo)向的AIOps平臺(tái),為企業(yè)現(xiàn)有運(yùn)維管理工具和管理體系賦予統(tǒng)一數(shù)據(jù)管控能力和智能化數(shù)據(jù)分析能力,全面提升運(yùn)維管理效率?,F(xiàn)階段AIOps的目標(biāo)不是NoOps,而是BetterOps,通過(guò)更高效的運(yùn)維幫助企業(yè)快速洞察人力難以企及的故障和問(wèn)題,準(zhǔn)確預(yù)測(cè)風(fēng)險(xiǎn),化被動(dòng)運(yùn)維為主動(dòng)運(yùn)維。”
AIOps智能運(yùn)維是突然出現(xiàn)的嗎?
在過(guò)去二十年里,人工智能技術(shù)的發(fā)展間歇性影響了ITOM的進(jìn)步,而AIOps只是這種影響的最新例證。因此,對(duì)于傳統(tǒng)企業(yè)來(lái)說(shuō),智能運(yùn)維并不是一個(gè)全新的理念,而是IT運(yùn)營(yíng)分析/運(yùn)維管理(ITOA/ITOM)體系與大數(shù)據(jù)和人工智能技術(shù)結(jié)合的產(chǎn)物。AIOps智能運(yùn)維平臺(tái)以ITOM/ITOA系統(tǒng)所采集的運(yùn)維大數(shù)據(jù)為基礎(chǔ),利用人工智能和機(jī)器學(xué)習(xí)算法對(duì)運(yùn)維數(shù)據(jù)進(jìn)行深入分析,涵蓋IT監(jiān)控,應(yīng)用性能管理、外網(wǎng)監(jiān)控、日志分析,系統(tǒng)安全等方面。
市面上流行的ITOM平臺(tái),其核心組件缺少大數(shù)據(jù)采集、分析和機(jī)器學(xué)習(xí)的能力,需要AIOps平臺(tái)予以完善。AIOps智能運(yùn)維平臺(tái)能夠接入不同業(yè)務(wù)系統(tǒng)、監(jiān)控系統(tǒng)、管理系統(tǒng)的海量IT數(shù)據(jù),并運(yùn)用各種算法進(jìn)行快速分析、學(xué)習(xí)甚至預(yù)測(cè)。立足于AIOps,IT部門(mén)可以獲得強(qiáng)大的IT決策和運(yùn)營(yíng)管理能力,并能對(duì)業(yè)務(wù)質(zhì)量和用戶體驗(yàn)進(jìn)行準(zhǔn)確檢測(cè)和持續(xù)優(yōu)化。
目前,國(guó)內(nèi)頂級(jí)互聯(lián)網(wǎng)及ICT企業(yè),如阿里、騰訊、華為、百度等,都成立專門(mén)的部門(mén)對(duì)AIOps體系開(kāi)展深入研究并逐步落地,甚至達(dá)到某種程度上的NoOps。但對(duì)于數(shù)字化轉(zhuǎn)型中的國(guó)內(nèi)大中型企業(yè)來(lái)說(shuō),互聯(lián)網(wǎng)模式的AIOps平臺(tái)無(wú)法滿足雙態(tài)IT環(huán)境、混合云環(huán)境、IoT場(chǎng)景下復(fù)雜事務(wù)流程的統(tǒng)一管控和效率提升需求,開(kāi)放度更高、工程化能力更強(qiáng)、應(yīng)用場(chǎng)景更聚焦的專業(yè)AIOps平臺(tái)解決方案才是企業(yè)客戶的首選。
AIOps智能運(yùn)維平臺(tái)選型的必備能力
現(xiàn)階段,數(shù)字化轉(zhuǎn)型的IT挑戰(zhàn)在于一方面要控制IT成本,另一方面又要提供支持更高復(fù)雜度的運(yùn)維管理能力。傳統(tǒng)ITOM產(chǎn)品在處理海量、多種類和高速數(shù)據(jù)時(shí)常常會(huì)遇到極大的壓力。更重要的是,這些監(jiān)控工具無(wú)法提供橫向業(yè)務(wù)追蹤和根因定位所需的多系統(tǒng)數(shù)據(jù)。
數(shù)字化業(yè)務(wù)要求IT運(yùn)維提供更快的響應(yīng)速度和更高的處理效率,因此AIOps智能運(yùn)維平臺(tái)需要提供如下能力:
? 提供獨(dú)立、開(kāi)放的歷史/實(shí)時(shí)數(shù)據(jù)采集、算法分析平臺(tái),整合IT數(shù)據(jù)和業(yè)務(wù)指標(biāo)數(shù)據(jù);
? 提供告警消噪(包括告警抑制、告警收斂等),消除誤報(bào)或冗余事件;
? 提供跨系統(tǒng)追蹤和關(guān)聯(lián)分析,有效進(jìn)行故障的根因分析;
? 設(shè)定動(dòng)態(tài)基線捕獲超出靜態(tài)閾值的異常,實(shí)現(xiàn)單/多指標(biāo)異常檢測(cè);
? 根據(jù)機(jī)器學(xué)習(xí)結(jié)果,預(yù)測(cè)未來(lái)事件,防止?jié)撛诘墓收?
? 直接或通過(guò)集成啟動(dòng)解決問(wèn)題的動(dòng)作;
AIOps平臺(tái)主要通過(guò)整合分析IT基礎(chǔ)設(shè)施、APM、NPM、日志、數(shù)字化體驗(yàn)監(jiān)測(cè)數(shù)據(jù),來(lái)提升IT運(yùn)維流程的效率,而AIOps平臺(tái)能力的ROI多是基于平均故障接手時(shí)間(MTTA)和平均故障修復(fù)(MTTR)時(shí)間這兩個(gè)指標(biāo)的降低進(jìn)行評(píng)估的。
主流AIOps平臺(tái)推薦
AIOps的發(fā)展獲得了業(yè)界的一致看好,Gartner同樣給出大膽預(yù)測(cè):未來(lái)2到5年內(nèi)AIOps將擴(kuò)展到IT服務(wù)管理和自動(dòng)化運(yùn)維領(lǐng)域,到了2022年,部署AIOps平臺(tái)的大型企業(yè)數(shù)量將從如今的不足5%,迅速提升到40%左右。
目前,AIOps市場(chǎng)可以說(shuō)是霧里看花,很多廠商都宣稱擁有自己的AIOps產(chǎn)品。下面,我們遴選了五家國(guó)內(nèi)外已經(jīng)實(shí)現(xiàn)智能運(yùn)維工程化的解決方案商,從他們的平臺(tái)能力和應(yīng)用場(chǎng)景等維度進(jìn)行橫向?qū)Ρ?,希望?duì)企業(yè)AIOps選型提供幫助。
注:以上部分?jǐn)?shù)據(jù)來(lái)自Moogsoft《Is 2018 the Year of AIOps?》
IBM、BMC等ITOM企業(yè),在傳統(tǒng)IT架構(gòu)的理解和人員規(guī)模等方面擁有強(qiáng)大的實(shí)力,而新興的軟件服務(wù)企業(yè)如Moogsoft、Splunk、Cloudwise等公司雖然規(guī)模不大,但是專注于AIOps相關(guān)領(lǐng)域的研發(fā),實(shí)力同樣不容小覷。BMC和IBM的AIOps解決方案主要滿足傳統(tǒng)IT場(chǎng)景下的IT資源管理、IT服務(wù)管理、IT 自動(dòng)化等需求,針對(duì)的用戶群體也是以L1/L2級(jí)運(yùn)維工程師為主,這也是此類企業(yè)和諸多由ITOM/ITSM轉(zhuǎn)型AIOps的服務(wù)商多年來(lái)積累的優(yōu)勢(shì)。而Cloudwise、Moogsoft和Splunk自誕生之時(shí)恰逢互聯(lián)網(wǎng)經(jīng)濟(jì)大潮的興起,其產(chǎn)品和解決方案更適合數(shù)字化和混合IT場(chǎng)景和現(xiàn)代企業(yè)的需求。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 螞蟻集團(tuán)架構(gòu)大調(diào)整:CTO線變革引領(lǐng)技術(shù)新潮流
- 蔚來(lái)智能駕駛重大調(diào)整:組織架構(gòu)重組,從"半成品"到"端到端"解決方案革新
- 滴滴致歉“臭車”事件,日產(chǎn)本田合并談判引關(guān)注,新車市波瀾再起
- 三星助力國(guó)內(nèi)手機(jī)廠商爭(zhēng)奪高端市場(chǎng),競(jìng)爭(zhēng)升級(jí),誰(shuí)將脫穎而出?
- 美團(tuán)騎手過(guò)度疲勞工作?強(qiáng)制下線跑單超時(shí)者,保障騎手健康與安全
- 王自如離職風(fēng)波揭開(kāi)真相:董明珠批緋聞無(wú)聊,職場(chǎng)風(fēng)波需理性對(duì)待
- 2024車市冷靜觀察:十大熱門(mén)車型背后的真實(shí)故事
- 中國(guó)云服務(wù)市場(chǎng)風(fēng)起云涌:阿里云、華為云、騰訊云三強(qiáng)爭(zhēng)霸,市場(chǎng)份額七成誰(shuí)主沉浮
- 微信小店“送禮物”功能全面推進(jìn):騰訊回應(yīng):逐步灰度測(cè)試中,小心謹(jǐn)慎不冒進(jìn)
- 雷諾集團(tuán)權(quán)衡日產(chǎn)與本田合并:利益最大化需謹(jǐn)慎抉擇
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。