今年全國兩會頻繁提及“數(shù)字化”,其中著重提到要發(fā)展數(shù)字經(jīng)濟,推進數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化,加強數(shù)字社會、數(shù)字政府建設(shè),提升公共服務(wù)、社會治理等數(shù)字化智能化水平。隨著數(shù)字化浪潮的來襲,數(shù)字化運維也成為IT系統(tǒng)建設(shè)中必不可少的重要環(huán)節(jié)。
數(shù)字化的系統(tǒng)建設(shè)是第一步且一次性的,而運維則是全年不停,7*24小時,每時每刻都不能缺少的。就像行業(yè)中流傳的那句經(jīng)典表述:“三分建設(shè)、七分運維”。當(dāng)相對短暫的系統(tǒng)建設(shè)完成后,就進入到了漫長的運維與運營階段——也就是“建轉(zhuǎn)運”的發(fā)生時。
目前中國數(shù)字化在進展到“建轉(zhuǎn)運”時,各行業(yè)發(fā)展的狀態(tài)相對不均衡,但隨著宏觀政策層面的指導(dǎo),以及企業(yè)自身的業(yè)務(wù)發(fā)展和技術(shù)的推動,可以預(yù)見,數(shù)字化運維的重要意義以及運維的價值將在不斷的實踐中愈發(fā)凸顯。
然而,隨著區(qū)塊鏈、虛擬化、容器、IoT等新技術(shù)的應(yīng)用,IT規(guī)模和復(fù)雜度呈指數(shù)增長,現(xiàn)如今的智能運維能否滿足企業(yè)對運維的需求呢?
如果想要回答這個問題,不妨先來看一下智能運維發(fā)展到了何種程度。
認(rèn)知不斷升級的“智能運維”
智能運維的概念最早由Gartner在2016年提出,從這時開始,智能運維進入了概念啟蒙階段。到2018年~2019年期間,市場普遍認(rèn)為智能運維主要依賴算法,各大廠商也在積極探索并在小范圍內(nèi)應(yīng)用。到了2020年,市場漸漸回歸理性。隨著人們對智能運維認(rèn)知程度的加深,行業(yè)內(nèi)達成了更加面向現(xiàn)實的共識:智能運維要以數(shù)據(jù)為基礎(chǔ)、以場景為導(dǎo)向、以算法為支撐。
也就是說,智能運維一定來源于非常好的數(shù)據(jù)基礎(chǔ),并應(yīng)該根據(jù)用戶的應(yīng)用場景和需求,將適合的算法和模式匹配到用戶的場景中。工程化算法要擬合數(shù)據(jù),根據(jù)數(shù)據(jù)和場景需求選擇或研發(fā)合適的算法。只有具備上述三個條件,才能真正形成一個真正工程化落地的智能運維。因此,對于智能運維服務(wù)商來說,既要有非常好的算法能力,又要對用戶的應(yīng)用場景有非常好的理解力,還要有工程化落地的能力。這幾種能力都具備,才能幫用戶解決問題。
對于云智慧來說,“以數(shù)據(jù)為基礎(chǔ)、以場景為導(dǎo)向、以算法為支撐”解決的是智能運維方法論的“戰(zhàn)術(shù)”問題,而要為用戶真正做好智能運維,還要解決“戰(zhàn)略”問題。
過去,IT運維的關(guān)注點在于底層設(shè)備的高可用和穩(wěn)定性,而如今,用戶的關(guān)注點更集中到業(yè)務(wù)層面,衡量IT對業(yè)務(wù)影響程度的指標(biāo)變成了MTTR(Mean Time to Recovery,平均故障修復(fù)時間),這就需要智能運維平臺能夠從業(yè)務(wù)的視角,實現(xiàn)覆蓋所有業(yè)務(wù)鏈路的端到端全局監(jiān)控、管理和分析,并與業(yè)務(wù)指標(biāo)進行關(guān)聯(lián)。IT系統(tǒng)要以保障業(yè)務(wù)連續(xù)性為目標(biāo),同時要為更高層面的業(yè)務(wù)決策賦能。這也是云智慧對運維最核心和本質(zhì)的理解——一切源于業(yè)務(wù)而又歸于業(yè)務(wù)。所以說,智能業(yè)務(wù)運維是IT運維與互聯(lián)網(wǎng)深度融合的產(chǎn)物,以用戶體驗為核心,以業(yè)務(wù)價值為導(dǎo)向,是運維管理在云計算、大數(shù)據(jù)技術(shù)推動下的必然結(jié)果。
站在業(yè)務(wù)視角看智能運維痛點
當(dāng)我們站在業(yè)務(wù)管理的視角重新審視智能業(yè)務(wù)運維的建設(shè)時,我們發(fā)現(xiàn),隨著IT和互聯(lián)網(wǎng)的發(fā)展,上線的業(yè)務(wù)系統(tǒng)逐漸增多,核心業(yè)務(wù)越來越依賴IT系統(tǒng)的穩(wěn)定運行,關(guān)鍵應(yīng)用的不間斷運行成為企業(yè)保持高效運行的基石,因此,智能業(yè)務(wù)運維要以“實現(xiàn)業(yè)務(wù)連續(xù)性”為最高目標(biāo),以可用性保障為重點,整合監(jiān)控體系、配置管理、服務(wù)臺、服務(wù)管理系統(tǒng)等模塊的數(shù)據(jù)和業(yè)務(wù)流程,落實可用性管理、安全合規(guī)管理、連續(xù)性管理和應(yīng)急管理。
其次,運維工作涉及到整個運維管理的全生命周期與全閉環(huán),而且每個場景之間從業(yè)務(wù)流程與數(shù)據(jù)角度是高度統(tǒng)一融合的,這種情況就客觀上要求智能業(yè)務(wù)運維能夠為每一個潛在的人工或低效環(huán)節(jié)賦能。因此,智能運維需要涵蓋運維工作在規(guī)劃準(zhǔn)備、監(jiān)控、事件管理、日志分析與服務(wù)管理的方方面面,而且操作上要更加簡單易用,從而幫助運維人員更精準(zhǔn)和快速地排查與分析問題,更加高效地處理運維過程中面臨的問題。
此外,智能運維的技術(shù)關(guān)鍵不是算法,因為用戶的應(yīng)用場景千差萬別,需求也各不相同?;诿鞔_的智能運維工程化落地場景,快速搭建人工智能工程化技術(shù)方案,才是算法工程化的最大挑戰(zhàn)。因此,要將智能運維的算法平臺化,通過算法平臺來滿足復(fù)雜的檢測、預(yù)測與分析類智能研發(fā)需求,覆蓋從業(yè)務(wù)場景分析、數(shù)據(jù)獲取到模型部署、性能監(jiān)控的全流程,打通算法開發(fā)、訓(xùn)練、發(fā)布各環(huán)節(jié),讓平臺具備優(yōu)秀的算法擴展能力,滿足更多產(chǎn)品對算法服務(wù)的調(diào)用,支撐更多智能運維場景。
新一代智能業(yè)務(wù)運維平臺問世
鑒于上述用戶在運維過程中面臨的痛點和難點,云智慧站在用戶視角,遵循“以數(shù)據(jù)為基礎(chǔ)、以算法為支撐、以場景為導(dǎo)向”的核心理念推出了新一代智能業(yè)務(wù)運維平臺。該平臺充分考慮到可落地的運維場景,覆蓋整個運維管理的全生命周期,幫助用戶構(gòu)建從技術(shù)到業(yè)務(wù)的完整監(jiān)控體系,在保障業(yè)務(wù)連續(xù)性的同時賦予業(yè)務(wù)快速迭代和創(chuàng)新能力,帶來業(yè)務(wù)與IT管理效能的提升。
該平臺由立體化監(jiān)控與管理工具集、數(shù)字化運維數(shù)據(jù)中臺和數(shù)據(jù)價值應(yīng)用與管理產(chǎn)品集組成。其中,立體化監(jiān)控與管理工具集從基礎(chǔ)設(shè)施、應(yīng)用性能到用戶體驗,涵蓋從業(yè)務(wù)到基礎(chǔ)設(shè)施的各個監(jiān)控層面,幫助用戶構(gòu)建從技術(shù)到業(yè)務(wù)的完整監(jiān)控體系。
數(shù)字化運維數(shù)據(jù)中臺通過打通后臺IT支撐系統(tǒng)與前臺業(yè)務(wù)應(yīng)用之間的信息斷層和管理斷層,向上提供數(shù)據(jù)與能力支撐,在快速響應(yīng)前臺的變化和創(chuàng)新需求的同時,向下保障系統(tǒng)穩(wěn)定可靠運行。
• 采控平臺:一站式提供各類采集任務(wù)的配置與自動化部署,提供針對各類日志、IT基礎(chǔ)設(shè)備等數(shù)據(jù)的采集、清洗、監(jiān)控、告警等功能,同時對采集任務(wù)和采集行為進行統(tǒng)一規(guī)范的調(diào)度和管控。
• 專業(yè)運維數(shù)據(jù)庫:提供高性能的一站式運維數(shù)據(jù)服務(wù),實時高效地接入用戶環(huán)境中的IT數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù),進行低成本存儲、高效計算、關(guān)聯(lián)分析建模,并通過接口的方式利用標(biāo)準(zhǔn)查詢語言提供各類數(shù)據(jù)檢索服務(wù)。
• 算法中心:提供算法管理、算法配置等功能,支持算法接入,智能化的數(shù)據(jù)分析、模型實驗訓(xùn)練與調(diào)優(yōu),支持算法泛型的發(fā)布與應(yīng)用,具備高可用、高并發(fā)的性能,為上層業(yè)務(wù)以及產(chǎn)品提供強大的算法能力。
• 配置中心:全面管理企業(yè)IT運維的元數(shù)據(jù)并確保數(shù)據(jù)的準(zhǔn)確性和唯一性,以可配置、可維護的數(shù)據(jù)支撐力量促進運維監(jiān)控、服務(wù)管理、運維自動化以及運營分析相關(guān)的數(shù)據(jù)消費場景落地實施。
• 指標(biāo)管理體系:分層構(gòu)建與管理來自客戶離散監(jiān)控系統(tǒng)的數(shù)據(jù),針對不同對象提供指標(biāo)、指標(biāo)閾值規(guī)則與業(yè)務(wù)健康度的統(tǒng)一定義,并利用智能算法實現(xiàn)異常指標(biāo)的問題排查與定位,為管理決策提供數(shù)據(jù)支撐。
此外,數(shù)據(jù)價值應(yīng)用與管理產(chǎn)品集根據(jù)用戶的不同業(yè)務(wù)場景和領(lǐng)域,提供一系列運維數(shù)據(jù)價值挖掘與分析能力。用戶可在基于指標(biāo)體系的監(jiān)控中心對運維大數(shù)據(jù)進行統(tǒng)一歸納、梳理,根據(jù)業(yè)務(wù)系統(tǒng)架構(gòu)進行層次化建模、分析,并進行集中展示;通過事件中心接入來自于各種監(jiān)控系統(tǒng)的告警消息,支持事件的通知、響應(yīng)、處置、跟蹤以及多維分析,實現(xiàn)面向告警事件全生命周期的閉環(huán)管控。
新一代智能業(yè)務(wù)運維平臺具備以下六大特點:
• 全棧解決方案:采用面向運維監(jiān)控、服務(wù)管理、可視化的all in one技術(shù)底座,提供智能業(yè)務(wù)運維全棧解決方案。
• 國產(chǎn)化適配:適配國產(chǎn)的主流CPU、操作系統(tǒng)、數(shù)據(jù)庫、中間件等,以支持國家信創(chuàng)產(chǎn)業(yè)的發(fā)展,構(gòu)建安全、自主、可控的信息技術(shù)應(yīng)用創(chuàng)新體系。
• 組件化:提供一站式、可配置、組件化的開發(fā)能力,可快速搭建復(fù)雜的分析與管理系統(tǒng)。
• 靈活,可擴展:提供面向不同行業(yè)、數(shù)百個應(yīng)用場景的模版,可快速交付項目進行定制開發(fā),支撐用戶創(chuàng)新應(yīng)用。
• 一站式:提供從數(shù)據(jù)采控、存儲、處理、建模、智能分析到數(shù)據(jù)應(yīng)用的一站式運維數(shù)據(jù)服務(wù),降低數(shù)據(jù)治理的總成本。
• 自監(jiān)控:具備完善的自監(jiān)控和自運維能力,保證平臺穩(wěn)定可靠運行。
憑借多年來在智能運維領(lǐng)域的深耕與實踐,云智慧的智能業(yè)務(wù)運維平臺已幫助各行業(yè)眾多用戶構(gòu)建和實施數(shù)字化運維。新一代智能業(yè)務(wù)運維平臺也將更加聚焦用戶業(yè)務(wù),具備更高與更全面的實施標(biāo)準(zhǔn),用更加精細化與敏捷化的解決方案攻破用戶在運維過程中面臨的新老問題。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )