告警類型有哪些
基礎監控:
告警內容 | 說明 | 處理建議 | 推送方式 |
---|---|---|---|
ping不可達 | ping服務器往目標機器的每個IP各發10個ping包,如果服務器沒有收到任何目標機器IP返回的數據包,則發出ping不可達告警。(用戶主動關機或到期隔離不會觸發此告警) | 1、請確認是否雲服務器有禁PING設置; 2、在雲服務器控製台查看雲主機狀態,可以嚐試重啟設備,觀察是否恢複。 |
短信,郵件 |
硬盤分區/** 隻讀 | 在機器每一個分區生成一個臨時文件,如果失敗,則發出隻讀告警。 (/**代表硬盤分區的名稱。) |
請重啟設備嚐試恢複。如果任然有問題,請提交工單聯係我們。 | 短信,郵件 |
硬盤使用率預警/告警 | 檢查磁盤分區的已使用空間,當已使用空間大於等於90%,且磁盤剩餘空間小於5G時,觸發告警。 | 請登錄設備,及時對相應分區進行硬盤清理。 | 郵件 |
CPU持續高負載 | 雲服務器的CPU利用率持續30分鍾大於95%。 | 登錄服務器查看服務器上運行的進程使用CPU的情況,檢查是否有進程運行異常,並對異常進程進行處理。
如果仍然有問題,請提交工單聯係我們。 |
郵件 |
內存不足告警 | 分析swap_in和swap_out,有一個指標超過20,並且持續15分鍾觸發告警。
隻有當swap_in和swap_out的值為0時,才判斷為告警恢複 |
機器內存不夠用。請查看是否有進程存在內存泄漏,或者內存使用不當。
您可能需要了解如何查看單個進程占用的內存大小? |
郵件 |
雲數據庫連接使用率告警 | 雲數據庫的連接使用率超過95%,發出告警。雲數據庫的連接使用率達到100%後,會導致新的雲數據庫連接失敗。
當連接使用率低於90%,告警恢複。 |
如果發生告警,請檢查程序中創建的數據庫連接是否達到實例的最大連接數,或是否有無用的連接未及時關閉導致連接被耗光,及時關閉沒用的連接,使連接使用率低於90%。
連接使用率的查看方法詳見雲數據庫監控指標說明。 |
短信,郵件 |
設備重啟告警 | 雲服務器因異常導致重啟。 | 雲服務器重啟後,請檢查服務器上的程序是否啟動,如果未啟動,需要開發者手動啟動相應程序。 | 短信,郵件 |
服務可用率告警 | 開發者在雲撥測中,配置撥測任務時會配置告警方案,當實際可用率低於告警方案中配置的值,且持續時間長於配置的值時,會產生服務可用率告警。 | 請檢查撥測的服務是否正常。 | 短信,郵件 |
雲數據庫磁盤空間使用率告警 | 雲數據庫空間使用率超過90%就會觸發告警。 | 1、刪除部分數據,釋放空間,如果是innodb的話還需要整理表空間的操作。 2、升級實例到更高規格 |
短信,郵件 |
外網帶寬使用率告警 | 檢查外網帶寬的已使用量,當已使用帶寬大於等於90%,且持續30分鍾,觸發告警。 | 請登錄設備,查看機器帶寬是否正常。 | 郵件 |
最後更新:2017-01-09 21:51:43