雲上全鏈路健康檢查亮相雲棲大會
10月12日雲棲大會上,雲上全鏈路健康檢查服務驚豔亮相,阿裏雲專家現場解讀如何通過服務,解決業務雲化後的各項問題。從產品類型選擇到容量規劃的困惑、如何發現問題風險、到故障修複與重大事件保障,絕大多數雲上問題都可以通過全鏈路檢查規避。
雲上穩定:風險監控與實施優化
該服務從業務架構到雲產品資源層麵,提供全鏈路健康檢查的服務保障體係,著眼於用戶最關注的穩定性問題。目前全鏈路檢查已覆蓋top10的雲產品,通過190多項評估規則監控使用狀況與數據,分析並幫助客戶發現雲上風險問題。目前係統內已實現150餘種應急方案,可針對具體風險和問題,給出可實施的解決方案和優化建議。
阿裏雲平台的付費用戶已超過100萬,阿裏雲也一直在持續提升業務係統在雲上運行的穩定性,以滿足更多客戶托付核心業務係統的信任與要求。
經驗沉澱:雙11曆年保障總結
阿裏雲服務團隊,擁有多年雲上係統穩定性提升和服務保障的一線經驗,吸收了阿裏巴巴集團曆次雙11護航保障的寶貴經驗,沉澱總結了基於全鏈路健康檢查的雲上服務保障體係,持續提升穩定性。
來自阿裏雲的技術專家周翰說道,“檢查將會通過對客戶核心業務係統進行相關調研、數據分析,發現業務係統在係統架構、產品選型、雲資源使用、監控管理、故障應急恢複上存在的問題和風險。使用阿裏雲PTS壓測產品模擬客戶實際業務場景和壓力,發現係統從雲資源到應用層麵的性能瓶頸點,確定業務係統的性能基線,產出業務係統的擴容方案與建議。”
周翰現場分享了一位客戶曾經使用全鏈路檢查時,發現CDN瓶頸導致業務不可用、實例性能不足、RDS資源爭搶等問題,使客戶能及時應對突發問題與故障。緊接著通過業務應急演練模擬從雲資源層麵到客戶業務層麵的各類問題故障,驗證和完善業務架構的容錯和自我保護能力,最終形成有針對性的、合理的解決方案和建議。最終阿裏雲幫助客戶持續提升係統穩定性,為客戶業務保駕護航。
將服務經驗傳遞給更多夥伴和客戶,將服務保障體係與所有生態合作夥伴一起不斷完善,將更多更好的服務提供給阿裏雲客戶,是阿裏雲服務團隊的共同願景。
最後更新:2017-10-17 15:03:39