云原生與AI共舞,可觀測體系帶來極致決策能力?

  AI時代的到來,向企業(yè)底層IT資源的豐富與敏捷提出了更大的挑戰(zhàn)。云原生已成為勢不可當的技術趨勢,利用云原生架構實現(xiàn)了對資源的靈活調度,為AI中臺奠定了敏捷而堅實的技術底座。那么在云原生的加持下,決策智能又將邁向怎樣的新高地?

  秒級精度觀測保障決策穩(wěn)定輸出

  在云原生時代,AI服務最大的特點就是,需要更大的算力支持,以及更穩(wěn)定的架構體系。這個新的架構體系就是以微服務、容器化、Serverless等技術為支撐的云原生架構。

  云原生架構在提升效率的同時,也帶來了更復雜的服務關系。如何快速定位問題,提供清晰的鏈路分析,使可觀測解決方案成為云原生架構下非常重要的課題。而在云原生環(huán)境下,可觀測性成功取代了傳統(tǒng)的監(jiān)控。

  可觀測性輸出可以準確反映系統(tǒng)狀態(tài)的特性,就好比汽車儀表盤一樣,實時動態(tài)顯示車輛的時速、油耗、燈光等狀態(tài)特征。自2018年“可觀測性”被引入互聯(lián)網領域,逐步發(fā)展成為云原生領域核心技術之一。當業(yè)務日益復雜,軟件架構復雜度隨之攀升。為保證服務的高可用、高性能,演化出了各種微服務拆分策略,使一個服務功能實現(xiàn)變成了基于分布式的多服務協(xié)作模式。此時監(jiān)控對象也由傳統(tǒng)的單體結構,變成分布式的多個微服務,數據規(guī)模、鏈路長度、服務管理、服務器資源耦合度都迎來挑戰(zhàn)。云原生環(huán)境下,可觀測性成功上位取代了傳統(tǒng)監(jiān)控。

  在云原生技術架構中,服務鏈路相互交錯復雜,單單維護監(jiān)控的運維同時無法高效根除問題。從錯誤告警入手排除故障比較容易,但探究問題深層次原因就需要熟悉業(yè)務代碼,通過追溯源碼發(fā)現(xiàn)問題根源,然而傳統(tǒng)監(jiān)控將以系統(tǒng)可用性、穩(wěn)定性為主要目標訴求。

  在數字化轉型的大環(huán)境中,企業(yè)更加強調智能決策。可觀測性技術經過對數據采集、聚合、分析加工之后,可提供系統(tǒng)全方位,實時狀態(tài)特征為輔助業(yè)務決策提供重要保障。而谷歌提出的首個專門面向應用運維的SRE理論體系,為業(yè)務應用系統(tǒng)提供強大穩(wěn)定性保障能力提供了重要指導,受到了越來越多的企業(yè)的青睞。

  對此,國內領先的AI決策解決方案提供商薩摩耶云在充分利用云原生以及深度學習等技術基礎上,提供全鏈路云原生決策智能科技解決方案,將開發(fā)關鍵步驟標準化、平臺化、可視化,將SRE理念融入安全運維管理體系,讓系統(tǒng)具有彈性伸縮、自愈性、可觀測性等特性,已安全穩(wěn)定應用于通訊、金融、電信、物流、電商、倉儲等大型場景中。

  這一解決方案不但提供了日志監(jiān)控能力,對日志、指標等數據進行自動化分析。大大提升了云平臺可觀測性,并以秒級精度分析系統(tǒng)請求參數、業(yè)務交易和數據交換,對云原生應用提供監(jiān)控、跟蹤、診斷等功能。

  數據庫作為現(xiàn)代數字基礎設施的核心,支撐了云原生應用對數據存儲和處理的各種需求。近年來,新型數據庫有效解決當下數據庫管理和運維中的痛點問題,在并發(fā)處理能力、可擴展性、架構統(tǒng)一性、場景靈活等方面有著諸多優(yōu)勢,經過多年的技術平臺建設以及運營體系的不斷完善,薩摩耶云在新型數據庫應用實踐方面深入探索,助力企業(yè)高效實現(xiàn)統(tǒng)一業(yè)務分析、日志分析,打造強大數據分析能力。

  通過持續(xù)進化升級,目前薩摩耶云云原生決策智能科技解決方案可對微服務全局的通信訪問、系統(tǒng)調用、平臺環(huán)境等數據進行深度分析,為企業(yè)IT人員提供監(jiān)控告警、故障定位及風險排查,滿足精細化決策需求。而基于人工智能與可觀測性技術體系的融合應用,薩摩耶云正探索通過異常檢測,回歸、關聯(lián)等算法進行異常分析、根因分析、容量預測,從而進一步保障系統(tǒng)的穩(wěn)定性。這一平臺也被艾瑞咨詢評選為《2021年中國人工智能產業(yè)研究報告》標桿案例。

  降低資源成本敏捷應對故障

  微服務技術讓IT系統(tǒng)變得更敏捷、更健壯、更高性能的同時,也帶來了架構復雜度的提升。微服務架構在本質上就是對彈性伸縮有著強烈訴求,在彈性伸縮過程中,不管是單應用的水平彈性伸縮,還是整套環(huán)境的啟停,資源利用率都對最終的資源成本起著決定性的作用。如果能想辦法提升資源利用率,就能為企業(yè)節(jié)省大量資源成本。對于企業(yè)而言,要想更好地駕馭微服務架構,需要解決持續(xù)集成、服務發(fā)現(xiàn)、應用通信、配置管理、流量防護等一系列難題。如何既輕松地構建微服務應用同時,又把資源降本做到極致,成為橫亙在不少企業(yè)面前的“難關”。

  資源利用率低的根本原因,在于以服務器為載體的應用架構中,開發(fā)者需要將構建好的程序包部署到服務器上,從而對多個用戶事件進行響應。為了確保事件響應的及時性,需要讓程序常駐于服務器上,而且盡可能保守的規(guī)劃資源,以避免出現(xiàn)負載過重而導致服務崩潰的情況。在這個過程中,實際的負載在時間上分配并不均衡,從而導致整體的資源利用率偏低。針對這一難點,薩摩耶云基于容器化技術和TEG數據驅動的探索,為提升資源利用率,打造高質量、易使用、靈活集成和安全可信的數據環(huán)境提供了新思路。

  薩摩耶云云原生決策智能科技解決方案將數據存儲計算分離、分層存儲,實現(xiàn)計算資源的按需分配并以精細化資源管理、自動彈性擴容和調度優(yōu)化資源利用率,這意味著企業(yè)可以專注在產品上,無需關注和操作復雜的服務器資源,大幅降低IT使用成本。而伴隨微服務架構逐漸演化為主流,開發(fā)能力與系統(tǒng)擴展性大幅提升,系統(tǒng)復雜性與服務不確定性隨之激增,系統(tǒng)風險成為可用性面臨的最大挑戰(zhàn)。不確定性,既然避不開,為何不擁抱它?混沌工程便應運而生。

  混沌工程是一種提升技術架構彈性能力的復雜技術手段,經過故障演練的實驗確保系統(tǒng)高可用,也有人將混沌工程比作疫苗,通過 “接種疫苗” 的方式,讓系統(tǒng)產生抗體具備抵御“重大疾病” 的能力?;谠圃cAI能力,薩摩耶云也在長期開展混沌工程,在其自身故障測試和演練實踐基礎上,結合更多業(yè)務場景不斷測試系統(tǒng)韌性,持續(xù)提升容錯能力和架構彈性,以可觀測性技術探查系統(tǒng)行為變化,賦予開發(fā)、運維人員可觀測能力,提前發(fā)現(xiàn)問題保障服務穩(wěn)定輸出。

  當下,云原生已然成為核心基礎設施,這對云服務底層系統(tǒng)韌性提出了更高要求。著眼于現(xiàn)實要求,薩摩耶云對混沌工程的探索和實踐,進一步提升了云原生底座的穩(wěn)定性和可靠性。而根植于云原生基礎之上,薩摩耶云的AI決策智能體系正助推產業(yè)變革升級,讓企業(yè)充分享受著數智時代紅利。

  未來,隨著數字化轉型、產業(yè)數字化建設持續(xù)深入,薩摩耶云等行業(yè)領先企業(yè)攜手對云原生以及決策智能技術體系持續(xù)進行探索,更多的實踐經驗將會沉淀為方法論,千行百業(yè)都將受益于此。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )