搭上數(shù)字化列車,帶你看看智能運維的新景象

今年全國兩會頻繁提及“數(shù)字化”,其中著重提到要發(fā)展數(shù)字經(jīng)濟,推進數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,加強數(shù)字社會、數(shù)字政府建設,提升公共服務、社會治理等數(shù)字化智能化水平。隨著數(shù)字化浪潮的來襲,數(shù)字化運維也成為IT系統(tǒng)建設中必不可少的重要環(huán)節(jié)。

數(shù)字化的系統(tǒng)建設是第一步且一次性的,而運維則是全年不停,7*24小時,每時每刻都不能缺少的。就像行業(yè)中流傳的那句經(jīng)典表述:“三分建設、七分運維”。當相對短暫的系統(tǒng)建設完成后,就進入到了漫長的運維與運營階段——也就是“建轉(zhuǎn)運”的發(fā)生時。

目前中國數(shù)字化在進展到“建轉(zhuǎn)運”時,各行業(yè)發(fā)展的狀態(tài)相對不均衡,但隨著宏觀政策層面的指導,以及企業(yè)自身的業(yè)務發(fā)展和技術的推動,可以預見,數(shù)字化運維的重要意義以及運維的價值將在不斷的實踐中愈發(fā)凸顯。

然而,隨著區(qū)塊鏈、虛擬化、容器、IoT等新技術的應用,IT規(guī)模和復雜度呈指數(shù)增長,現(xiàn)如今的智能運維能否滿足企業(yè)對運維的需求呢?

如果想要回答這個問題,不妨先來看一下智能運維發(fā)展到了何種程度。

認知不斷升級的“智能運維”

智能運維的概念最早由Gartner在2016年提出,從這時開始,智能運維進入了概念啟蒙階段。到2018年~2019年期間,市場普遍認為智能運維主要依賴算法,各大廠商也在積極探索并在小范圍內(nèi)應用。到了2020年,市場漸漸回歸理性。隨著人們對智能運維認知程度的加深,行業(yè)內(nèi)達成了更加面向現(xiàn)實的共識:智能運維要以數(shù)據(jù)為基礎、以場景為導向、以算法為支撐。

搭上數(shù)字化列車,帶你看看智能運維的新景象

也就是說,智能運維一定來源于非常好的數(shù)據(jù)基礎,并應該根據(jù)用戶的應用場景和需求,將適合的算法和模式匹配到用戶的場景中。工程化算法要擬合數(shù)據(jù),根據(jù)數(shù)據(jù)和場景需求選擇或研發(fā)合適的算法。只有具備上述三個條件,才能真正形成一個真正工程化落地的智能運維。因此,對于智能運維服務商來說,既要有非常好的算法能力,又要對用戶的應用場景有非常好的理解力,還要有工程化落地的能力。這幾種能力都具備,才能幫用戶解決問題。

對于云智慧來說,“以數(shù)據(jù)為基礎、以場景為導向、以算法為支撐”解決的是智能運維方法論的“戰(zhàn)術”問題,而要為用戶真正做好智能運維,還要解決“戰(zhàn)略”問題。

搭上數(shù)字化列車,帶你看看智能運維的新景象

過去,IT運維的關注點在于底層設備的高可用和穩(wěn)定性,而如今,用戶的關注點更集中到業(yè)務層面,衡量IT對業(yè)務影響程度的指標變成了MTTR(Mean Time to Recovery,平均故障修復時間),這就需要智能運維平臺能夠從業(yè)務的視角,實現(xiàn)覆蓋所有業(yè)務鏈路的端到端全局監(jiān)控、管理和分析,并與業(yè)務指標進行關聯(lián)。IT系統(tǒng)要以保障業(yè)務連續(xù)性為目標,同時要為更高層面的業(yè)務決策賦能。這也是云智慧對運維最核心和本質(zhì)的理解——一切源于業(yè)務而又歸于業(yè)務。所以說,智能業(yè)務運維是IT運維與互聯(lián)網(wǎng)深度融合的產(chǎn)物,以用戶體驗為核心,以業(yè)務價值為導向,是運維管理在云計算、大數(shù)據(jù)技術推動下的必然結果。

站在業(yè)務視角看智能運維痛點

當我們站在業(yè)務管理的視角重新審視智能業(yè)務運維的建設時,我們發(fā)現(xiàn),隨著IT和互聯(lián)網(wǎng)的發(fā)展,上線的業(yè)務系統(tǒng)逐漸增多,核心業(yè)務越來越依賴IT系統(tǒng)的穩(wěn)定運行,關鍵應用的不間斷運行成為企業(yè)保持高效運行的基石,因此,智能業(yè)務運維要以“實現(xiàn)業(yè)務連續(xù)性”為最高目標,以可用性保障為重點,整合監(jiān)控體系、配置管理、服務臺、服務管理系統(tǒng)等模塊的數(shù)據(jù)和業(yè)務流程,落實可用性管理、安全合規(guī)管理、連續(xù)性管理和應急管理。

其次,運維工作涉及到整個運維管理的全生命周期與全閉環(huán),而且每個場景之間從業(yè)務流程與數(shù)據(jù)角度是高度統(tǒng)一融合的,這種情況就客觀上要求智能業(yè)務運維能夠為每一個潛在的人工或低效環(huán)節(jié)賦能。因此,智能運維需要涵蓋運維工作在規(guī)劃準備、監(jiān)控、事件管理、日志分析與服務管理的方方面面,而且操作上要更加簡單易用,從而幫助運維人員更精準和快速地排查與分析問題,更加高效地處理運維過程中面臨的問題。

此外,智能運維的技術關鍵不是算法,因為用戶的應用場景千差萬別,需求也各不相同。基于明確的智能運維工程化落地場景,快速搭建人工智能工程化技術方案,才是算法工程化的最大挑戰(zhàn)。因此,要將智能運維的算法平臺化,通過算法平臺來滿足復雜的檢測、預測與分析類智能研發(fā)需求,覆蓋從業(yè)務場景分析、數(shù)據(jù)獲取到模型部署、性能監(jiān)控的全流程,打通算法開發(fā)、訓練、發(fā)布各環(huán)節(jié),讓平臺具備優(yōu)秀的算法擴展能力,滿足更多產(chǎn)品對算法服務的調(diào)用,支撐更多智能運維場景。

新一代智能業(yè)務運維平臺問世

鑒于上述用戶在運維過程中面臨的痛點和難點,云智慧站在用戶視角,遵循“以數(shù)據(jù)為基礎、以算法為支撐、以場景為導向”的核心理念推出了新一代智能業(yè)務運維平臺。該平臺充分考慮到可落地的運維場景,覆蓋整個運維管理的全生命周期,幫助用戶構建從技術到業(yè)務的完整監(jiān)控體系,在保障業(yè)務連續(xù)性的同時賦予業(yè)務快速迭代和創(chuàng)新能力,帶來業(yè)務與IT管理效能的提升。

搭上數(shù)字化列車,帶你看看智能運維的新景象

該平臺由立體化監(jiān)控與管理工具集、數(shù)字化運維數(shù)據(jù)中臺和數(shù)據(jù)價值應用與管理產(chǎn)品集組成。其中,立體化監(jiān)控與管理工具集從基礎設施、應用性能到用戶體驗,涵蓋從業(yè)務到基礎設施的各個監(jiān)控層面,幫助用戶構建從技術到業(yè)務的完整監(jiān)控體系。

數(shù)字化運維數(shù)據(jù)中臺通過打通后臺IT支撐系統(tǒng)與前臺業(yè)務應用之間的信息斷層和管理斷層,向上提供數(shù)據(jù)與能力支撐,在快速響應前臺的變化和創(chuàng)新需求的同時,向下保障系統(tǒng)穩(wěn)定可靠運行。

• 采控平臺:一站式提供各類采集任務的配置與自動化部署,提供針對各類日志、IT基礎設備等數(shù)據(jù)的采集、清洗、監(jiān)控、告警等功能,同時對采集任務和采集行為進行統(tǒng)一規(guī)范的調(diào)度和管控。

• 專業(yè)運維數(shù)據(jù)庫:提供高性能的一站式運維數(shù)據(jù)服務,實時高效地接入用戶環(huán)境中的IT數(shù)據(jù)和業(yè)務數(shù)據(jù),進行低成本存儲、高效計算、關聯(lián)分析建模,并通過接口的方式利用標準查詢語言提供各類數(shù)據(jù)檢索服務。

• 算法中心:提供算法管理、算法配置等功能,支持算法接入,智能化的數(shù)據(jù)分析、模型實驗訓練與調(diào)優(yōu),支持算法泛型的發(fā)布與應用,具備高可用、高并發(fā)的性能,為上層業(yè)務以及產(chǎn)品提供強大的算法能力。

• 配置中心:全面管理企業(yè)IT運維的元數(shù)據(jù)并確保數(shù)據(jù)的準確性和唯一性,以可配置、可維護的數(shù)據(jù)支撐力量促進運維監(jiān)控、服務管理、運維自動化以及運營分析相關的數(shù)據(jù)消費場景落地實施。

• 指標管理體系:分層構建與管理來自客戶離散監(jiān)控系統(tǒng)的數(shù)據(jù),針對不同對象提供指標、指標閾值規(guī)則與業(yè)務健康度的統(tǒng)一定義,并利用智能算法實現(xiàn)異常指標的問題排查與定位,為管理決策提供數(shù)據(jù)支撐。

此外,數(shù)據(jù)價值應用與管理產(chǎn)品集根據(jù)用戶的不同業(yè)務場景和領域,提供一系列運維數(shù)據(jù)價值挖掘與分析能力。用戶可在基于指標體系的監(jiān)控中心對運維大數(shù)據(jù)進行統(tǒng)一歸納、梳理,根據(jù)業(yè)務系統(tǒng)架構進行層次化建模、分析,并進行集中展示;通過事件中心接入來自于各種監(jiān)控系統(tǒng)的告警消息,支持事件的通知、響應、處置、跟蹤以及多維分析,實現(xiàn)面向告警事件全生命周期的閉環(huán)管控。

搭上數(shù)字化列車,帶你看看智能運維的新景象

新一代智能業(yè)務運維平臺具備以下六大特點:

• 全棧解決方案:采用面向運維監(jiān)控、服務管理、可視化的all in one技術底座,提供智能業(yè)務運維全棧解決方案。

• 國產(chǎn)化適配:適配國產(chǎn)的主流CPU、操作系統(tǒng)、數(shù)據(jù)庫、中間件等,以支持國家信創(chuàng)產(chǎn)業(yè)的發(fā)展,構建安全、自主、可控的信息技術應用創(chuàng)新體系。

• 組件化:提供一站式、可配置、組件化的開發(fā)能力,可快速搭建復雜的分析與管理系統(tǒng)。

• 靈活,可擴展:提供面向不同行業(yè)、數(shù)百個應用場景的模版,可快速交付項目進行定制開發(fā),支撐用戶創(chuàng)新應用。

• 一站式:提供從數(shù)據(jù)采控、存儲、處理、建模、智能分析到數(shù)據(jù)應用的一站式運維數(shù)據(jù)服務,降低數(shù)據(jù)治理的總成本。

• 自監(jiān)控:具備完善的自監(jiān)控和自運維能力,保證平臺穩(wěn)定可靠運行。

憑借多年來在智能運維領域的深耕與實踐,云智慧的智能業(yè)務運維平臺已幫助各行業(yè)眾多用戶構建和實施數(shù)字化運維。新一代智能業(yè)務運維平臺也將更加聚焦用戶業(yè)務,具備更高與更全面的實施標準,用更加精細化與敏捷化的解決方案攻破用戶在運維過程中面臨的新老問題。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )