在今天這樣的一個云原生時代,業(yè)務系統(tǒng)不斷上云,容器、微服務、持續(xù)發(fā)布等云原生技術被廣泛采用,從而為IT系統(tǒng)的可控性帶來了全新挑戰(zhàn)。我們應該以什么樣的方式對云原生應用進行監(jiān)控和管理——為保障云原生應用的穩(wěn)定性,可觀測技術被越來越多的企業(yè)所采用。
在了解之前需要明確的是可觀測性不僅是對技術的要求,更需要團隊融入可觀察性的理念,近些年,隨著可觀測性技術進一步普及,越來越多的企業(yè)進入嘗試階段,并逐步開展實施。通過可觀測性技術,看到表象,鎖定問題,解決問題,不僅成為企業(yè)系統(tǒng)內部狀態(tài)的重要衡量方式,也成為解決系統(tǒng)問題的首選方案,這在阿里、騰訊、奇虎360及B站早已實現了穩(wěn)步落地,并逐漸解鎖產品研發(fā)的各個場景中。
為梳理行業(yè)的最佳實踐,GOPS 全球運維大會·深圳站特別邀請了多位可觀測性領域資深技術專家,希望在可觀測性技術平臺的架構理念、大數據技術下的云原生監(jiān)控等多方面,與眾多參會嘉賓共同探討未來可觀測性實踐的更多可能。
李煌東,阿里巴巴架構師
演講主題:基于 eBPF 的 Kubernetes 可觀測性最佳實踐
Kubernetes監(jiān)控是ARMS打造的基于eBPF、實現無侵入、支持多語言&多協(xié)議的Kubernetes可觀測一站式工具,核心場景支持應用黃金指標、應用拓撲感知、網絡流量&性能分析、資源消耗分析等,具有無侵入、多語言、多協(xié)議的特點。本Topic將介紹:1、Kubernetes集群運維的痛點及應對方案;2、阿里Kubernetes監(jiān)控的最佳實踐和商業(yè)化路線
演講提綱:
1、 什么是可觀測性?
2、 Kubernetes中的可觀測性痛點?
3、 Kubernetes監(jiān)控解決方案、挑戰(zhàn)
4、 Under the hood – Prometheus(事實標準)+ eBPF(超能力)
5、 Kubernetes問題排查全景圖
6、 案例分析
7、 演進路線
胡喆騫,奇虎360 資深技術專家
演講主題:大數據技術下的云原生監(jiān)控
面對多云異構環(huán)境下,數萬臺服務器、數千臺交換機,不僅需要專業(yè)的人員、嚴謹的流程,更需要適合新環(huán)境下的高效工具。基于可觀測性理念的新一代工具,可以有效應對云原生時代下對于運維的艱難挑戰(zhàn)。本次將圍繞異構環(huán)境下,使用智能化工具對數據采集、指標度量、鏈路追蹤領域的便捷性進行說明。
演講提綱:
1、企業(yè)當前的業(yè)務變遷——離線業(yè)務為主變?yōu)樵诰€業(yè)務為主
2、場景增多面對挑戰(zhàn)的新應對——可發(fā)現、可度量、可追溯、可管理
3、大數據與云原生——云原生技術與大數據下產品形態(tài)
4、云原生監(jiān)控的未來——云原生、大數據、AI相結合下更精準的監(jiān)控
梁俊杰,騰訊IEG SRE技術專家
演講主題:騰訊IEG可觀測平臺的建設及SRE實踐
分享騰訊藍鯨可觀測平臺的設計理念及架構設計,并介紹在平臺建設過程中,如何通過SRE理念落地實踐,提高系統(tǒng)的交付質量及降低系統(tǒng)的運維成本。
演講提綱:
1、騰訊藍鯨可觀測平臺設計理念
2、騰訊藍鯨可觀測平臺架構設計
3、平臺建設中的SRE實踐
武安闖,bilibili基礎架構部 在線業(yè)務SRE負責人
演講主題:B站SRE的穩(wěn)定性實踐與反思
SRE如何轉型落地?B站SRE做了什么事情?SRE按Google SRE模式實踐是最佳嗎?我們對Google SRE有哪些反思?本次分享會從組織轉型,多活容災、容量管理、活動保障、故障處理、質量運營等多個方面解析B站的穩(wěn)定性體系建設實踐與反思。
演講提綱:
1、從業(yè)務運維到SRE的轉型
2、SRE穩(wěn)定性保障體系建設實踐
3、SRE的左與右,再轉型
4、SRE文化的建設與推廣
張越,騰訊TEG 資深架構師
演講主題:多元化可觀測體系建設思考與實踐
隨著研發(fā)效能戰(zhàn)略的推進,可觀測性作為最常用且重要的能力,受到越來越多的關注。騰訊內部業(yè)務呈現多元化特點,可觀測能力的統(tǒng)一就成為了挑戰(zhàn)。本次分享將主要介紹騰訊TEG在滿足多元化業(yè)務的可觀測體系方面的設計思路、架構演進過程,以及在落地中的關鍵技術實踐。希望我們在實踐中總結的經驗教訓和思路可以為大家在探索可觀測性帶來幫助。
演講提綱:
1、騰訊TEG可觀測背景
· 多元化業(yè)務背景下的可觀測
· 痛點和挑戰(zhàn)
2、可觀測體系構建思路和架構演進
· 可觀測體系結構設計思路
· 架構演進思路
3、可觀測核心問題落地實踐
· TSDB設計
· 信息整合和關聯(lián)
· 告警準確率
4、總結和展望
以上簡介為 GOPS 全球運維大會 2022 · 深圳站的一部分
更多精彩內容請參見大會日程,報名參會可關注大會官網
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )