雲監控ECS監控插件安裝方法__技術分享_技術運維問題_雲監控-阿裏雲
雲監控針對ECS實例的監控需要安裝監控插件。
1.在雲監控控製台上,如果ECS實例未安裝插件,則雲監控狀態會顯示為“點擊安裝”,如下圖:
2.等待幾分鍾,雲監控插件將監控數據上報到雲監控係統中,控製台顯示如下圖:
對於一些特殊ECS實例無法通過雲監控控製台進行插件安裝的,控製台將提供手工安裝提示,可參考以下方式進行插件安裝。
注意:下列操作需要使用administrator或者root權限執行安裝與卸載的操作:
有公網IP地址雲監控組件安裝
1. Linux類係統:
1) 確認操作係統中已有unzip、iostat命令。如果沒有,請通過yum install unzip sysstat或apt-get install unzip sysstat進行安裝。
2) wget https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/cms_install.sh
3) chmod +x cms_install.sh
4) ./cms_install.sh
安裝完成後,請等待5分鍾後檢查服務器列表。
2. Windows係統:
1) 下載https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/win32/aegis_quartz.zip
2) Windows 32bit, 解壓至C:Program FilesAlibabaAegisaegis_quartz
3) Windows 64bit, 解壓至C:Program Files (x86)AlibabaAegisaegis_quartz
15分鍾後在控製台觀察是否有數據。
無公網IP地址雲監控組件安裝
1. Linux類係統:
1) 確認操作係統中已有unzip、iostat命令。如果沒有,請通過yum install unzip sysstat或apt-get install unzip sysstat進行安裝。
2) wget https://cloudmonitor-agent.oss-cn-hangzhou-internal.aliyuncs.com/aegis/cms_install.sh
3) chmod +x cms_install.sh
4) ./cms_install.sh
安裝完成後,請等待5分鍾後檢查服務器列表。
2. Windows係統:
1) 下載https://cloudmonitor-agent.oss-cn-hangzhou-internal.aliyuncs.com/aegis/win32/aegis_quartz.zip
2) Windows 32bit, 解壓至C:Program FilesAlibabaAegisaegis_quartz
3) Windows 64bit, 解壓至C:Program Files (x86)AlibabaAegisaegis_quartz
15分鍾後在控製台觀察是否有數據。
VPC網絡下雲監控組件安裝:
1.Linux 安裝腳本下載: https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/cms_install.sh
2.Windows 安裝軟件下載: https://update3.aegis.aliyun.com/download/win32/updates/update_00_70/aegis_inst.exe
常見問題:
一、雲監控裏麵雲服務監控,監控列表和內存使用率數據展示為N/A,怎麼辦?
問題排查方法:
若您已經升級至新版本雲盾,但沒有看到監控數據,可按照以下幾種方式排查。
1.檢查監控模塊是否安裝成功:
1).Windows用戶請在任務管理器中查看是否有aegis_quartz.exe進程。
2).Linux用戶請ps查看是否有aegis_quartz進程。
2.檢查網絡是否連接,您可以嚐試telnet open.cms.aliyun.com 80,若網絡不通,檢查您是否設置了安全組策略或防火牆ACL規則。
二、 通道沉默是什麼概念?
通道沉默是指,當某一條報警發出後,如果這個異常在24小時之內未被處理,則24小時內不會再次觸發報警。
舉個例子:設置ECS的CPU使用率超過80%時報警,則當CPU使用率>80%且達到重試次數時,會觸發報警規則發送報警短信,如果24小時內沒有處理這個異常,CPU使用率持續超過80%,則24小時之內不會再次發送報警信息。如果24小時內異常恢複後再次發生異常,則仍然會觸發報警信息。
三、“重試幾次後報警”這個功能是立即重試還是按周期重試,例如,我設置的監控項是5分鍾一次上報,重試3次報警,那麼是15分鍾後報警,還是立即重試3次然後報警呢?
是按照周期重試,15分鍾後報警
四、對於站點監測的一個監控項,杭州和青島的監測都出現異常,那麼一天之內是給客戶發一次短信還是2次?
這個和報警策略的設置有關,如果設置為組合報警,則杭州和青島的監測都發生異常才會報警。如果是獨立報警,則其中任何一個監測點發生異常,都會報警。建議您設置為組合報警,減少因網絡抖動等非站點本身原因造成的報警。
五、站點監控和雲服務監控項是否有設置個數限製?
站點監控項設置個數最大為200個,雲服務監控項暫時沒有設置個數限製。
最後更新:2016-07-12 12:03:56
上一篇:
雲服務器 ECS Linux SSH 基於密鑰交換的自動登錄原理簡介及配置說明__遠程登錄 (SSH)_Linux操作運維問題_雲服務器 ECS-阿裏雲
下一篇:
訪問鏈路問題排查__常見問題_產品使用問題_容器服務-阿裏雲
雲解析OpenAPI使用規範__雲解析OPEN API_產品使用問題_雲解析-阿裏雲
OSS掛載__操作指南_批量計算-阿裏雲
簡單操作 OSS 文件__Spark_開發人員指南_E-MapReduce-阿裏雲
金融風控__阿裏雲ET介紹-阿裏雲
刪除自定義鏡像__鏡像_用戶指南_雲服務器 ECS-阿裏雲
DeleteObject__關於Object操作_API 參考_對象存儲 OSS-阿裏雲
刪除定時任務__定時任務相關功能_API參考_彈性伸縮-阿裏雲
PutRow__API 概覽_API 參考_表格存儲-阿裏雲
原生SDK介紹__Java SDK介紹_MapReduce_大數據計算服務-阿裏雲
修改自定義鏡像信息__鏡像_用戶指南_雲服務器 ECS-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲