性能監控介紹
簡介
性能監控,是網易蜂巢提供的自助運維工具,目的是幫助你監控集群運行狀態,發現異常問題,還可以進行數據下鑽,快速定位到問題具體發生的位置。目前提供的是標準版(Beta)服務,僅支持蜂巢官方 Tomcat 鏡像的集群監控。
功能特點
- 服務的整體監測
- 網絡拓撲圖
- 健康狀態
- 響應時間
- 請求次數、頻率
- 錯誤次數、頻率
- 慢相應次數
- 健康狀態監測
- 服務的健康狀態反映了服務當前發生問題的嚴重程度,幫助用戶識別哪些問題需要優先處理。用戶可以設定服務健康判定條件組合,性能監測係統會根據設定,自動判斷當前服務的狀態,給出服務健康的實時描述信息。例如,我們可以設定,對於每分鍾請求次數大於 50 次的請求,當服務的錯誤率大於平均值的 3 倍標準差時,認為服務處於嚴重警告狀態。
- 錯誤監測
- 錯誤包括請求的錯誤狀態碼,打印的錯誤日誌,以及服務處理請求時拋出的異常信息。我們會將所有發生的錯誤信息統計出來,提供給用戶分析。當前版本我們僅支持了錯誤狀態碼的監測,後續將支持異常信息和錯誤日誌的監測。
- 慢響應監測
- 慢響應會影響用戶體驗,也代表當前服務的運行狀態不佳,需要關注。係統提供了默認的判定規則,用戶也可以自行修改。性能監測係統根據規則,判定每條請求是否達到了慢相應的標準,給出對慢響應的描述信息。
- 明細記錄和快照
- 性能監測服務,提供了請求明細記錄、錯誤記錄、慢響應記錄,用於服務問題的分析。針對錯誤記錄和慢響應記錄,還提供了快照信息,描述在一個請求鏈路中的整體狀況,幫助用戶定位具體發生問題的環節。
- 告警通知
- 利用性能監測的健康事件,我們可以設定告警通知,當服務健康出現異常時,可以及時收到通知信息,迅速解決問題。
產品優勢
- 更寬的視野
- 服務運行時的所有狀態信息,自動收集、匯總到統一的性能監控平台;
- 服務網絡拓撲圖,提供了服務的運行環境的全景信息;
- 請求快照的全鏈路拓撲圖,匯總了一個請求處理過程的各個環節的具體信息。
- 更快的定位
- 快照自動保留問題發生現場,無需複現問題,即可完成問題定位;
- 服務管理列表性能數據 -> 明細數據 -> 快照數據,層層深入快速定位到問題具體發生的位置。
快速入口
最後更新:2017-01-03 10:48:57