雲服務器 ECS 監控:監控ECS實例
一般來說,在本地數據中心我們會對基礎設施進行監控,其中包括對主機實例的監控,以便係統地和隨時地了解資源使用情況和性能變化,在出現性能瓶頸的時候合理地調配資源,或者在發生故障時追溯原因等等。
在阿裏雲上,ECS實例也承載著我們的業務應用,ECS實例的資源使用情況和性能負載直接影響著其上應用的運行穩定性和用戶體驗度。假如沒有進行監控,就很有可能在業務高峰期性能不足卻無人問津而導致宕機;也可能在出現異常和故障的時候,因為沒有曆史性能數據而無法進一步追查到原因,可見,沒有監控,當問題出現的時候,都非常被動。
因此,監控是非常有必要的,是構建完整IT係統不可或缺的一個元素,下麵就來介紹如何對ECS實例進行監控。
使用Dashboard
雲監控的Dashboard功能提供用戶自定義查看監控數據的功能。用戶可以在一張監控大盤中跨產品、跨實例查看監控數據,將相同業務的不同產品實例集中展現。既能滿足排查故障時查看監控細節,又能滿足總覽大局時查看服務概貌。
操作步驟
1、登錄雲監控控製台。
2、點擊左側菜單的“Dashboard”選項,進入Dashboard頁麵。可以看到默認展示的“ECS全局監控大盤”。
3、可以看到默認的“ECS全局監控大盤”已經包含了比較豐富的監控項了,包括CPU使用率、網絡流入/流出帶寬、係統磁盤BPS、係統盤IOPS、網絡流入/流出量。基本已經可以滿足日常監控需求。
4、如果業務比較複雜,需要自定義監控可視化需求時,可以創建新的監控大盤,點擊頁麵右上角的“創建監控大盤”,輸入監控大盤的名稱。
5、然後可以在該大盤上添加雲產品指標和用戶的業務監控指標。
6、添加雲產品指標。
a) 選擇需要查看的雲產品和實例所在地域;
b) 定義圖標名稱,圖表名稱默認為您生成“產品名稱+區域”,選擇圖表展現形式;
c) 選擇需要查看的監控項、選擇監控數據的聚合方式,常見聚合方式為最大值、最小值、平均值、選擇過濾條件、選擇Group By的維度。
7、添加業務指標監控。
a) 定義圖表名稱、指標名稱、圖表類型;
b) 選擇需要查看的監控數據並定義處理方式;
c) 點擊發布。
主機監控
雲監控主機監控服務通過在服務器上安裝插件,為用戶提供服務器的係統監控服務。主機監控服務采集豐富的操作係統層麵監控指標,可以使用主機監控服務進行服務器資源使用情況的查詢和排查故障時的監控數據查詢。
操作步驟
1、登錄雲監控控製台。
2、通過選擇左側菜單的主機監控,進入主機監控頁麵。
3、點擊實例列表中的“點擊安裝”插件,安裝雲監控插件。
4、1-3分鍾後即可點擊實例列表頁的“監控圖表”查看監控數據。
5、可以看到有操作係統監控、基礎監控、進程監控。其中涵蓋了CPU、內存、負載、磁盤、網絡、進程各麵的性能統計,並且可以根據時間範圍來展示圖標數據。
6、創建報警規則。
a) 切換到報警規則頁麵;
b) 點擊“這裏”創建規則;
c) 在新建報警規則頁麵填寫設置報警的具體參數;
d) 保存規則設置,完成報警規則的創建。
站點監控
如果ECS實例提供的主要業務應用是網站類型,可以考慮使用站點監控模擬真實用戶訪問情況,探測API可用性、端口連通性、DNS解析等問題。可以探測域名、IP、端口的連通性、訪問響應時間,並對監控結果報警。
操作步驟
1、登錄雲監控控製台。
2、點擊站點管理,進入站點監控頁麵。
3、點擊頁麵右上角的創建監控點,添加新的監測點。
5、查看站點監控詳情。
開源監控產品介紹
目前業內有不少開源的監控軟件,包括zabbix、nagios、zenoss等,每個產品都有各自的特色和優勢,下麵分別簡單介紹一下以上幾款產品。
- zabbix
Zabbix是一個基於WEB界麵的提供分布式係統監控以及網絡監控功能的企業級開源運維平台,也是目前國內互聯網用戶中使用最廣的監控軟件,85%以上的泛互聯網企業都在使用Zabbix做監控解決方案。
zabbix入門容易、上手簡單、功能強大並且開源免費,它易於管理和配置,能生成比較漂亮的數據圖,其自動發現功能大大減輕日常管理的工作量,豐富的數據采集方式和API接口可以讓用戶靈活進行數據采集,而分布式係統架構可以支持監控更多的設備。理論上,通過Zabbix提供的插件式架構,可以滿足企業的任何需求。
- nagios
Nagios是一款開源的企業級監控係統,能夠實現對係統CPU、磁盤、網絡等方麵參數的基本係統監控,以及SMTP,POP3,HTTP,NNTP等各種基本的服務類型。另外通過安裝插件和編寫監控腳本,用戶可以實現應用監控,並針對大量的監控主機和多個對象部署層次化監控架構。
Nagios最大的特點是其強大的管理中心,盡管其功能是監控服務和主機的,但Nagios自身並不包括這部分功能代碼,所有的監控、告警功能都是由相關插件完成的。
- zenoss
Zenoss Core是Zenoss的開源版本,其商用版本為ZenossEnterprise。作為企業級智能監控軟件,Zenoss Core允許IT管理員依靠單一的WEB控製台來監控網絡架構的狀態和健康度。Zenoss Core的強大能力來自於深入的列表與配置管理數據庫,以發現和管理公司IT環境的各類資產。Zenoss同時提供與CMDB關聯的事件和錯誤管理係統,以協助提高各類事件和提醒的管理效率。
Zabbix vs 雲監控
Zabbix是第三方開源監控軟件,是一個基於WEB界麵的提供分布式係統監視以及網絡監視功能的企業級的開源解決方案。
zabbix能監視各種網絡參數,保證服務器係統的安全運營;並提供靈活的通知機製以讓係統管理員快速定位/解決存在的各種問題。
雲監控既指在雲端運行的監控工具,也指監控在雲端運行的應用程序的工具。通過和雲計算平台的整合,針對網絡、係統、應用等內容提供可用性、用戶體驗和安全性方麵的監控服務。
雲監控的到來,無疑給那些對技術不太熟悉的人員帶來了福音,可以通過頁麵點擊就可以創建自己的監控項。
產品 | 優點 | 缺點 |
---|---|---|
Zabbix | 支持多平台、分布式; 安裝部署簡單,多種數據采集插件靈活集成; 可實現複雜多條件告警; 自帶畫圖功能,得到的數據可以繪成圖形; 提供多種API接口,支持調用腳本; 出現問題時可自動遠程執行命令; |
項目批量修改不方便; 中文資料較少,服務支持有限; 入門容易,但是深層次需要非常熟悉zabbix並進行大量的二次定製開發,難度較大; 係統級別報警、報警郵件、自定義項目報警需要自己設置,過程繁瑣; 缺少數據匯總功能,數據報表也需要進行二次開發; |
雲監控 | 無前期成本投入; 無需獨立服務器; 配置及添加監控項簡單; 頁麵風格比較適合國人操作; |
部分平台免費版功能較少,企業級應用費用較高; 賬戶管理功能較弱; 修改監控點配置不方便; 自定義監控配置麻煩,部分需寫腳本; 監控項目單一; 部分監控項無法實現圖形化顯示; |
可以看出,各有各的優劣勢。雲監控降低我們監控的門檻,給我們提供了便利,但是在一定程度上限製了自定義和擴展。而zabbix可以靈活集成並可通過二次開發實現複雜功能,但是對人員和技能的要求也比較高。
對於上監控以更好地保障係統上線後穩定運行,我們還需要關注監控的一些方法。
除了需要了解我們的常規的監控項如硬件資源、性能、帶寬、端口、進程、服務的檢測機製之外,還要具備安全意識,比如需要知道哪些服務器可能出現問題,可能被入侵等。
另外,需要定義監控策略,包括告警的優先級、告警內容等;對監控的業務係統進行分級,比如一級係統7*24小時告警,二級係統7*12小時告警。
如果架構比較龐大,也可以對監控對象範圍進行分類,如服務器監控、應用程序監控、數據庫監控、網絡監控等,根據監控對象再細分監控項。每個維護人員都可以根據企業環境總結出一套適合於自身的監控體係,並逐漸精細化和智能化。
通過使用阿裏雲雲監控,能較好地對我們的ECS實例進行監控,使我們及時了解業務的運行狀態,並及時提供告警,讓我們可以快速定位故障,對我們管理和維護ECS提供了可靠的支持。當然,在此基礎上我們也可以結合如zabbix之類的開源監控軟件,進一步實現對ECS實例更全麵和精準的監控。
最後更新:2017-08-14 16:02:22