云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測(cè)性能力

CNCF在云原生的定義中,將可觀測(cè)性(Observability)明確為一項(xiàng)必備要素。因此,使用云原生應(yīng)用架構(gòu),享受其帶來的效率提升時(shí),不得不面對(duì)的是如何構(gòu)建匹配的可觀測(cè)性能力。

可觀測(cè)性并不是通過簡(jiǎn)單使用一個(gè)工具所能具備,是需要根據(jù)企業(yè)組織、業(yè)務(wù)應(yīng)用、基礎(chǔ)設(shè)施以及已有的監(jiān)控體系的需求現(xiàn)狀,明確階段目標(biāo),伴隨著業(yè)務(wù)發(fā)展逐步建立,是一個(gè)持續(xù)發(fā)展的過程。云杉網(wǎng)絡(luò)與客戶的共同實(shí)踐,基于云原生應(yīng)用發(fā)展的現(xiàn)狀,通過DeepFlow與客戶的應(yīng)用、網(wǎng)絡(luò)、基礎(chǔ)設(shè)施整合,綜合分析各類指標(biāo)、日志以及追蹤數(shù)據(jù),形成一站式的容器化微服務(wù)可觀測(cè)性方案。

可觀測(cè)性,必須要解決以下問題:

1.在數(shù)百個(gè)服務(wù)中發(fā)現(xiàn)瓶頸:提供非采樣,秒級(jí)精度,提供HTTP/DNS/GRPC等性能指標(biāo)數(shù)據(jù)

2.在數(shù)千個(gè)訪問中追蹤應(yīng)用:提供應(yīng)用層Trace追蹤數(shù)據(jù),網(wǎng)絡(luò)層Flow追蹤數(shù)據(jù)

3.在數(shù)萬個(gè)容器中定位根因:提供全棧(API、主機(jī)、基礎(chǔ)設(shè)施)端到端指標(biāo)數(shù)據(jù)、日志數(shù)據(jù)

注意,解決上述問題,還需要零侵?jǐn)_、多維度和實(shí)時(shí)性。

云杉網(wǎng)絡(luò)DeepFlow v5.0產(chǎn)品,在NPM基礎(chǔ)上,利用classic BPF技術(shù),通過host的用戶態(tài)(零侵?jǐn)_)監(jiān)控到主機(jī)及虛機(jī)的系統(tǒng)和網(wǎng)卡流量。DeepFlow v6.0產(chǎn)品,利用eBPF技術(shù),進(jìn)一步在零侵?jǐn)_的前提下獲取了應(yīng)用和sidecar的信息,擴(kuò)展了多維度的能力。

過去三年時(shí)間,云杉網(wǎng)絡(luò)DeepFlow產(chǎn)品中的關(guān)鍵數(shù)據(jù)組件,經(jīng)歷了兩次重要的升級(jí)。2018年使用ES作為主要引擎,讀寫速度無法滿足實(shí)時(shí)性要求,只能為數(shù)百臺(tái)規(guī)模的業(yè)務(wù)集群實(shí)施可觀測(cè)性。

1.2020年初,DeepFlow v5.5發(fā)布,融入了深度優(yōu)化的InfluxDB作為Metrics引擎,使平臺(tái)性能提升10倍,可以解決數(shù)千臺(tái)服務(wù)器集群的可觀測(cè)性。

2.2021年12月,DeepFlow v6.0的第一個(gè)版本發(fā)布,進(jìn)一步融入了深度優(yōu)化的ClickHouse作為觀測(cè)數(shù)據(jù)的OLAP,讀寫性能再提升10倍,滿足金融及互聯(lián)網(wǎng)客戶的數(shù)萬規(guī)模的集群部署。

DeepFlow容器化微服務(wù)可觀測(cè)性方案

DeepFlow提供適用于容器化微服務(wù)的可觀測(cè)性,解決云原生應(yīng)用診斷難的核心痛點(diǎn)。通過對(duì)全局微服務(wù)間的通信訪問、系統(tǒng)調(diào)用、平臺(tái)環(huán)境等數(shù)據(jù)進(jìn)行深度分析,提供監(jiān)控告警、故障定位及風(fēng)險(xiǎn)排查,保障業(yè)務(wù)在云原生環(huán)境中的穩(wěn)定、高效運(yùn)行。

云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測(cè)性能力

DeepFlow可觀測(cè)性整體架構(gòu)圖

分鐘級(jí)定位問題邊界:基于容器化微服務(wù)的云原生應(yīng)用出現(xiàn)故障時(shí),快速明確問題邊界是解決問題的第一步?;谥R(shí)圖譜、微服務(wù)調(diào)用鏈、全棧追蹤等功能組合,快速檢索到異常單元所關(guān)聯(lián)涉及到的其他維度信息和影響范圍;直觀展示系統(tǒng)、容器、虛擬主機(jī)全棧性能指標(biāo)鎖定性能洼地等。

大幅提升排障效率:排障過程并不僅是找到故障根因并修復(fù),而是從定位、根因、修復(fù)、驗(yàn)證及預(yù)防一整套運(yùn)維保障操作閉環(huán)。容器環(huán)境疊加微服務(wù)架構(gòu)使得排障更加復(fù)雜,需要有效地將應(yīng)用、容器平臺(tái)、系統(tǒng)調(diào)用等運(yùn)維數(shù)據(jù)進(jìn)行關(guān)聯(lián),且對(duì)比指標(biāo)、跟蹤以及日志特征來提高根因的準(zhǔn)確性;并通過歷史視圖、系統(tǒng)運(yùn)行表現(xiàn)、修復(fù)驗(yàn)證等指標(biāo)來確認(rèn)從而提升效率。

微服務(wù)可用性指標(biāo):應(yīng)用微服務(wù)化后,衡量判斷眾多微服務(wù)的質(zhì)量以及可用性是一個(gè)繁瑣的問題。涉及到不同開發(fā)團(tuán)隊(duì),設(shè)定具體指標(biāo),周期性的記錄和評(píng)估,發(fā)現(xiàn)性能洼地及熱點(diǎn)等等。這些工作都是要建立在數(shù)據(jù)積累的基礎(chǔ)之上,DeepFlow平臺(tái)也是基于此來進(jìn)行對(duì)微服務(wù)各維度的畫像評(píng)估。通過對(duì)應(yīng)用中所涉及的幾十、上百個(gè)微服務(wù)運(yùn)行的歷史指標(biāo)數(shù)據(jù)進(jìn)行量化分析,在一個(gè)運(yùn)行周期中,能實(shí)時(shí)監(jiān)控業(yè)務(wù)是否達(dá)到99.99%的可用性要求,并分析出潛在影響可用性的各種原因。

DeepFlow容器化微服務(wù)可觀測(cè)性方案,面向公有云K8s、容器環(huán)境。利用eBPF等新技術(shù)的零侵入特性實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)、系統(tǒng)、應(yīng)用的全棧黃金指標(biāo)的采集。對(duì)服務(wù)調(diào)用鏈以及Service mesh、iptables/ipvs、NAT的逐跳鏈路追蹤,對(duì)服務(wù)訪問的零采樣全留存,并結(jié)合云資源知識(shí)圖譜和變更事件數(shù)據(jù),搭建立體化的微服務(wù)可觀測(cè)平臺(tái)。保障云及微服務(wù)業(yè)務(wù)有序可控發(fā)展。

構(gòu)建云原生可觀測(cè)性能力

云杉網(wǎng)絡(luò)提供容器化微服務(wù)可觀測(cè)免費(fèi)試用版本,試用期內(nèi)免費(fèi)且無限量部署采集器。可享受業(yè)務(wù)零侵入部署,深度體驗(yàn)DeepFlow全棧鏈路追蹤等能力,為平臺(tái)開發(fā)團(tuán)隊(duì)、業(yè)務(wù)開發(fā)團(tuán)隊(duì)、技術(shù)運(yùn)營(yíng)團(tuán)隊(duì)帶來一鍵部署即可享受的‘輕便體驗(yàn)’,幫助企業(yè)更順暢地走上云原生之旅。

云杉網(wǎng)絡(luò)DeepFlow幫助企業(yè)構(gòu)建云原生可觀測(cè)性能力

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )