閱讀242 返回首頁    go iPhone_iPad_Mac_apple


雲監控ECS監控插件安裝方法__技術分享_技術運維問題_雲監控-阿裏雲

 

 

雲監控針對ECS實例的監控需要安裝監控插件。

1.在雲監控控製台上,如果ECS實例未安裝插件,則雲監控狀態會顯示為“點擊安裝”,如下圖:

11.JPG

2.等待幾分鍾,雲監控插件將監控數據上報到雲監控係統中,控製台顯示如下圖:

12.JPG

 

 

對於一些特殊ECS實例無法通過雲監控控製台進行插件安裝的,控製台將提供手工安裝提示,可參考以下方式進行插件安裝。

注意:下列操作需要使用administrator或者root權限執行安裝與卸載的操作:

有公網IP地址雲監控組件安裝

1. Linux類係統:

  1) 確認操作係統中已有unzip、iostat命令。如果沒有,請通過yum install unzip sysstat或apt-get install unzip sysstat進行安裝。

  2) wget https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/cms_install.sh

  3) chmod +x cms_install.sh

  4) ./cms_install.sh

      安裝完成後,請等待5分鍾後檢查服務器列表。

 

2. Windows係統:

  1) 下載https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/win32/aegis_quartz.zip

  2) Windows 32bit, 解壓至C:Program FilesAlibabaAegisaegis_quartz

  3) Windows 64bit, 解壓至C:Program Files (x86)AlibabaAegisaegis_quartz

     15分鍾後在控製台觀察是否有數據。

 

無公網IP地址雲監控組件安裝

1. Linux類係統:

  1) 確認操作係統中已有unzip、iostat命令。如果沒有,請通過yum install unzip sysstat或apt-get install unzip sysstat進行安裝。

  2) wget https://cloudmonitor-agent.oss-cn-hangzhou-internal.aliyuncs.com/aegis/cms_install.sh

  3) chmod +x cms_install.sh

  4) ./cms_install.sh

      安裝完成後,請等待5分鍾後檢查服務器列表。

 

2. Windows係統:

  1) 下載https://cloudmonitor-agent.oss-cn-hangzhou-internal.aliyuncs.com/aegis/win32/aegis_quartz.zip

  2) Windows 32bit, 解壓至C:Program FilesAlibabaAegisaegis_quartz

  3) Windows 64bit, 解壓至C:Program Files (x86)AlibabaAegisaegis_quartz

     15分鍾後在控製台觀察是否有數據。

VPC網絡下雲監控組件安裝:

1.Linux 安裝腳本下載: https://cloudmonitor-agent.oss-cn-hangzhou.aliyuncs.com/aegis/cms_install.sh
2.Windows 安裝軟件下載: https://update3.aegis.aliyun.com/download/win32/updates/update_00_70/aegis_inst.exe

 

常見問題:

 一、雲監控裏麵雲服務監控,監控列表和內存使用率數據展示為N/A,怎麼辦?

問題排查方法:

若您已經升級至新版本雲盾,但沒有看到監控數據,可按照以下幾種方式排查。

1.檢查監控模塊是否安裝成功:

   1).Windows用戶請在任務管理器中查看是否有aegis_quartz.exe進程。

   2).Linux用戶請ps查看是否有aegis_quartz進程。

2.檢查網絡是否連接,您可以嚐試telnet open.cms.aliyun.com 80,若網絡不通,檢查您是否設置了安全組策略或防火牆ACL規則。

二、 通道沉默是什麼概念?

        通道沉默是指,當某一條報警發出後,如果這個異常在24小時之內未被處理,則24小時內不會再次觸發報警。

          舉個例子:設置ECS的CPU使用率超過80%時報警,則當CPU使用率>80%且達到重試次數時,會觸發報警規則發送報警短信,如果24小時內沒有處理這個異常,CPU使用率持續超過80%,則24小時之內不會再次發送報警信息。如果24小時內異常恢複後再次發生異常,則仍然會觸發報警信息。

 

三、“重試幾次後報警”這個功能是立即重試還是按周期重試,例如,我設置的監控項是5分鍾一次上報,重試3次報警,那麼是15分鍾後報警,還是立即重試3次然後報警呢?

       是按照周期重試,15分鍾後報警

 

四、對於站點監測的一個監控項,杭州和青島的監測都出現異常,那麼一天之內是給客戶發一次短信還是2次?

       這個和報警策略的設置有關,如果設置為組合報警,則杭州和青島的監測都發生異常才會報警。如果是獨立報警,則其中任何一個監測點發生異常,都會報警。建議您設置為組合報警,減少因網絡抖動等非站點本身原因造成的報警。

 

五、站點監控和雲服務監控項是否有設置個數限製?

        站點監控項設置個數最大為200個,雲服務監控項暫時沒有設置個數限製。


 

 

 

 

 

最後更新:2016-07-12 12:03:56

  上一篇:go 雲服務器 ECS Linux SSH 基於密鑰交換的自動登錄原理簡介及配置說明__遠程登錄 (SSH)_Linux操作運維問題_雲服務器 ECS-阿裏雲
  下一篇:go 訪問鏈路問題排查__常見問題_產品使用問題_容器服務-阿裏雲