原標(biāo)題:不虛談AIOps,你要的全面可實(shí)施方案都在這里了
一個(gè)全球部署的商用云平臺(tái)系統(tǒng)使用AIOps系統(tǒng),對(duì)2000多個(gè)節(jié)點(diǎn)進(jìn)行實(shí)時(shí)監(jiān)控,可以平均提前兩個(gè)小時(shí)預(yù)警系統(tǒng)異常;而某個(gè)電商企業(yè)引入AIOps后,能夠?qū)ξ磥硪欢螘r(shí)間內(nèi)的運(yùn)營(yíng)數(shù)值進(jìn)行精準(zhǔn)預(yù)測(cè),生成動(dòng)態(tài)基線來監(jiān)控和告警,故障發(fā)現(xiàn)的準(zhǔn)確率也可能會(huì)提升至80%或更高,極大提升企業(yè)的運(yùn)營(yíng)效率。
如果說最初的運(yùn)維就是發(fā)現(xiàn)問題和解決問題,那么數(shù)字化的出現(xiàn)改變了IT運(yùn)維的本質(zhì);它引入了圍繞服務(wù)可用性、性能和敏捷性的新需求;但這些需求也對(duì)運(yùn)維管理提出了更高的要求,否則可能導(dǎo)致服務(wù)質(zhì)量的惡化、對(duì)業(yè)務(wù)需求的遲鈍相應(yīng)以及IT運(yùn)營(yíng)中的成本增加。
在這種情況下,智能化運(yùn)維AIOps成為了越來越多企業(yè)的選擇。
下個(gè)趨勢(shì)將是AIOps
現(xiàn)代IT運(yùn)營(yíng)的目標(biāo)之一是深入了解IT系統(tǒng)的歷史狀態(tài),并通過學(xué)習(xí)和分析,預(yù)判和調(diào)節(jié)整個(gè)IT平臺(tái)的潛在未來狀態(tài)。如IDC在一份《IT運(yùn)營(yíng)分析調(diào)查》的報(bào)告中所說,“53%的企業(yè)在今天將采用IT運(yùn)營(yíng)分析(ITOA)視為其整體云戰(zhàn)略的關(guān)鍵任務(wù)”。
雖然自動(dòng)化技術(shù)有助于應(yīng)對(duì)一些數(shù)字化運(yùn)營(yíng)帶來的新挑戰(zhàn),但大部分技術(shù)在產(chǎn)生大量數(shù)據(jù)的同時(shí),卻缺乏從大量系統(tǒng)生成的日志中處理、關(guān)聯(lián)和挖掘洞察的能力;但是企業(yè)需要更具有前瞻性、可預(yù)測(cè)的智能IT運(yùn)營(yíng),從而有助于建立新的、敏捷的業(yè)務(wù)模型,并支持創(chuàng)新計(jì)劃,從而保持企業(yè)的領(lǐng)先地位。
根據(jù)Gartner的分析預(yù)測(cè),到2022年,所有大型企業(yè)中,40%的企業(yè)將使用AIOps工具,將大數(shù)據(jù)和機(jī)器學(xué)習(xí)功能結(jié)合起來,支持和部分取代現(xiàn)在5%以上的監(jiān)控,服務(wù)臺(tái)和自動(dòng)化流程和任務(wù),并且“客戶對(duì)使用AIOps功能已經(jīng)表現(xiàn)出越來越多的興趣,應(yīng)用大數(shù)據(jù)和機(jī)器學(xué)習(xí)來簡(jiǎn)化工單和CMDB流程、促進(jìn)自動(dòng)化?!?/span>
離不開的人工智能
典型的AIops落地場(chǎng)景包括異常檢測(cè)、動(dòng)態(tài)基線、根因分析、故障預(yù)測(cè)和應(yīng)用性能監(jiān)控等。簡(jiǎn)單來說,為了更好地支持業(yè)務(wù),AIOps將人工智能引入了運(yùn)維中的監(jiān)控和故障分析領(lǐng)域,探索更有效穩(wěn)定的系統(tǒng)運(yùn)行效果。
比如面對(duì)大量組件構(gòu)成的復(fù)雜系統(tǒng),以及在系統(tǒng)經(jīng)常面臨變更,從而要求人工對(duì)監(jiān)控設(shè)置不斷進(jìn)行調(diào)整的情況下,就可以通過歷史數(shù)據(jù)的機(jī)器學(xué)習(xí)來動(dòng)態(tài)預(yù)測(cè)數(shù)據(jù)的趨勢(shì),并通過大量的歷史數(shù)據(jù)形成每個(gè)組件自身的行為模型,從而實(shí)現(xiàn)基于動(dòng)態(tài)畫像的系統(tǒng)異常檢測(cè)和基于學(xué)習(xí)組件行為模型的異常主動(dòng)預(yù)測(cè)。
此外,隨著企業(yè)應(yīng)用的大量微服務(wù)化,業(yè)務(wù)之間的調(diào)用以API的形式出現(xiàn),傳統(tǒng)的應(yīng)用性能監(jiān)控方式很難統(tǒng)一的反應(yīng)出應(yīng)用性能的實(shí)時(shí)情況;而且目前大量的系統(tǒng)擴(kuò)縮容策略都是基于閾值(也就是一定的基線)設(shè)置的,很難及時(shí)根據(jù)實(shí)時(shí)狀態(tài)進(jìn)行調(diào)整;這時(shí),通過AIOps,就可以實(shí)現(xiàn)“動(dòng)態(tài)基線”的效果,基于歷史數(shù)據(jù),利用智能算法深度學(xué)習(xí),對(duì)未來一段時(shí)間內(nèi)每個(gè)時(shí)間點(diǎn)的數(shù)值進(jìn)行精準(zhǔn)預(yù)測(cè),將預(yù)測(cè)值作為基線來監(jiān)控和告警。
又或者,當(dāng)業(yè)務(wù)運(yùn)營(yíng)問題需要轉(zhuǎn)化為技術(shù)問題來解決時(shí),通常面臨系統(tǒng)故障問題定位困難的情況,而且在今天越來越復(fù)雜的分布式系統(tǒng)面前,需要考慮更多的系統(tǒng)關(guān)聯(lián)性,而且往往一個(gè)故障的發(fā)生,可能涉及一連串的應(yīng)用API調(diào)用,如果不能實(shí)現(xiàn)基于智能的根因分析(RCA),快速完成故障定位及解決將會(huì)非常困難。
端到端的全面服務(wù)
想象一下,一個(gè)解決方案可以在問題出現(xiàn)之前實(shí)時(shí)乃至預(yù)先解決;這就是智能化運(yùn)維所蘊(yùn)含的價(jià)值。
因此,越來越多的企業(yè)和組織開始重視并采用AIOps,通過認(rèn)知與自動(dòng)化相結(jié)合的運(yùn)營(yíng)平臺(tái),實(shí)現(xiàn)企業(yè)混合多云架構(gòu)智能運(yùn)維的轉(zhuǎn)型目標(biāo)。
比如,某大型商業(yè)銀行數(shù)據(jù)中心系統(tǒng)通過AIOps,能夠檢測(cè)包括Unix、Linux以及Windows在內(nèi)的近千臺(tái)服務(wù)器節(jié)點(diǎn),提前14小時(shí)檢測(cè)出應(yīng)用節(jié)點(diǎn)出現(xiàn)資源消耗異常,并最終導(dǎo)致異常退出的故障;以及某個(gè)商業(yè)云平臺(tái)能從1000多個(gè)節(jié)點(diǎn)中,快速過濾出30多個(gè)異常點(diǎn),并根據(jù)置信度給予優(yōu)先排序,幫助應(yīng)用人員快速定位問題。
雖然AIOps是趨勢(shì),但由于AIOps涉及“歷史數(shù)據(jù)管理”、“流數(shù)據(jù)管理”、“自動(dòng)模式發(fā)現(xiàn)與預(yù)測(cè)”、“根本原因確定”、“內(nèi)部部署交付”等多種功能需求,并需要熟悉不同行業(yè)的特定業(yè)務(wù)流程;迄今為止,很少有供應(yīng)商能提供全面的AIOps平臺(tái)。
與其他服務(wù)提供商不同,IBM基于自身在各行業(yè)的最佳實(shí)踐經(jīng)驗(yàn),提供從設(shè)計(jì)、構(gòu)建到管理解決方案的端到端專業(yè)服務(wù),并以服務(wù)的方式進(jìn)行快速交付,幫助客戶降低運(yùn)營(yíng)成本。
IBM全球信息科技服務(wù)部推出的智能運(yùn)維使用完全托管的IT分析解決方案,提供AIOps即服務(wù)的交付模式,該方案可提取企業(yè)IT運(yùn)營(yíng)數(shù)據(jù),并采用預(yù)先構(gòu)建的機(jī)器學(xué)習(xí)模型進(jìn)行數(shù)據(jù)的統(tǒng)計(jì)、分析,提供深刻洞察及自動(dòng)化服務(wù)。
獲取IBM AIOPS白皮書,請(qǐng)掃碼:
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車整車股盤初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。