您當前的位置:首頁 > 體育

乾貨分享|告警分析與彙報可以這麼簡單!

作者:由 睿象雲 發表于 體育時間:2020-05-24

運維工程師工作的一個難題是告警事件後的分析和彙報,首先是多平臺資料的整合分析,然後要結合歷史告警記錄分析,最後還要用比較好的方式展示資料報表!一次分析和彙報通常要耗費大量的時間精力,身邊不少運維工程師對此都只能無奈搖頭!

為了解放廣大的運維人群,我們推出了智慧告警平臺(Cloud Alert) CA,能快速接入各類告警資訊,透過自動去重、規則壓縮、演算法降噪,實現告警降噪,幫助it運維團隊減少告警,避免告警風暴;同時透過分派、排班、通知等功能,快速實現告警流程化管理,幫助運維團隊更快響應告警,恢復告警,提升告警管理能力。

CA提供多維度報表幫助您快速分析告警、成員工作效率,概覽系統執行狀況。支援自定義時間段,回溯分析歷史系統狀況。

乾貨分享|告警分析與彙報可以這麼簡單!

乾貨分享|告警分析與彙報可以這麼簡單!

關鍵指標分析

事件量: 原始告警量

· 主告警量: 自動去重、規則壓縮後告警量

· 壓縮比: 壓縮比計算公式:(1 - 主告警量/事件量) * 100%

· MTTA: 告警平均響應or認領時長

· MTTR: 告警平均恢復or關閉時長

事件壓縮分析

· 按天統計事件量、所有告警、主告警量隨時間變化趨勢

· 點選右上角 more 按鈕,可下鑽檢視更多分析,若回溯分析時間跨度過長,還可以按月維度統計事件量、主告警量、所有告警量

乾貨分享|告警分析與彙報可以這麼簡單!

應用分析&關閉分析

· 應用分析: 統計查詢時間週期內,不同應用的告警數量;

· 關閉分析: 統計透過外部系統關閉、超時自動關閉、手動關閉三種方式關閉對應不同應用的關閉告警數量;

· 應用分析中點選右上角 more 按鈕,可下鑽選擇不同應用按天檢視告警

乾貨分享|告警分析與彙報可以這麼簡單!

告警級別&狀態分析

· 統計查詢時間週期內,不同級別(提醒、警告、嚴重)佔比,及告警當前處理狀態(待認領、處理中、已關閉)。

· 支援聯動查詢:所有嚴重級別告警,當前處理狀態分別是什麼。

· 點選右上角 more 按鈕,可下鑽檢視所有告警詳單。

乾貨分享|告警分析與彙報可以這麼簡單!

成員分析

· 統計查詢時間週期內,團隊所有成員的告警處理效率:被分派告警量、認領告警量、關閉告警量、MTTA、MTTR。

· 支援下鑽檢視每個成員被分派的告警詳單。

告警智慧分類分析

· CA內建分類演算法,基於告警全文字分析,自動標註告警分類。

· 提供本週期與上週期對比分析,快速定位不同分類告警數量差異及變化情況。

· 分類型別內建,無需自定義,目前支援12種分類:網路狀態、硬體處理器、硬體記憶體、作業系統、磁碟、WEB應用、訊號檢測、資料庫、基礎元件、應用監控、容器、其他等。分類演算法還在持續迭代最佳化中,敬情期待。

Top告警內容分析

· 統計查詢時間週期內,不同告警內容的發生頻率並進行排序,快速定位頻繁發生的告警。

· 對於頻繁發生的告警,需分析是否需要統一徹底解決,或者是否需要調整監控平臺的告警閾值等。

· 對於不頻繁發生的告警,更需要額外警惕,往往不經常發生的告警,導致的問題更嚴重,定位根因更久,修復耗時更長。

新奇事件TOP10

· 今日新奇事件TOP10:相較於昨天,今日新發生的事件;

· 本週新奇事件TOP10:相較於上週,本週新發生的事件。

更多功能歡迎訪問睿象雲智慧運維平臺官網進行體驗~

標簽: 告警  分析  關閉  運維  事件