阅读136 返回首页    go 网易 go 网易蜂巢


性能监控介绍

目录

简介

性能监控,是网易蜂巢提供的自助运维工具,目的是帮助你监控集群运行状态,发现异常问题,还可以进行数据下钻,快速定位到问题具体发生的位置。目前提供的是标准版(Beta)服务,仅支持蜂巢官方 Tomcat 镜像的集群监控。

功能特点

  • 服务的整体监测
    • 网络拓扑图
    • 健康状态
    • 响应时间
    • 请求次数、频率
    • 错误次数、频率
    • 慢相应次数
  • 健康状态监测
    • 服务的健康状态反映了服务当前发生问题的严重程度,帮助用户识别哪些问题需要优先处理。用户可以设定服务健康判定条件组合,性能监测系统会根据设定,自动判断当前服务的状态,给出服务健康的实时描述信息。例如,我们可以设定,对于每分钟请求次数大于 50 次的请求,当服务的错误率大于平均值的 3 倍标准差时,认为服务处于严重警告状态。
  • 错误监测
    • 错误包括请求的错误状态码,打印的错误日志,以及服务处理请求时抛出的异常信息。我们会将所有发生的错误信息统计出来,提供给用户分析。当前版本我们仅支持了错误状态码的监测,后续将支持异常信息和错误日志的监测。
  • 慢响应监测
    • 慢响应会影响用户体验,也代表当前服务的运行状态不佳,需要关注。系统提供了默认的判定规则,用户也可以自行修改。性能监测系统根据规则,判定每条请求是否达到了慢相应的标准,给出对慢响应的描述信息。
  • 明细记录和快照
    • 性能监测服务,提供了请求明细记录、错误记录、慢响应记录,用于服务问题的分析。针对错误记录和慢响应记录,还提供了快照信息,描述在一个请求链路中的整体状况,帮助用户定位具体发生问题的环节。
  • 告警通知
    • 利用性能监测的健康事件,我们可以设定告警通知,当服务健康出现异常时,可以及时收到通知信息,迅速解决问题。
性能监控可以帮助你解决如下问题:

产品优势

  • 更宽的视野
    • 服务运行时的所有状态信息,自动收集、汇总到统一的性能监控平台;
    • 服务网络拓扑图,提供了服务的运行环境的全景信息;
    • 请求快照的全链路拓扑图,汇总了一个请求处理过程的各个环节的具体信息。
  • 更快的定位
    • 快照自动保留问题发生现场,无需复现问题,即可完成问题定位;
    • 服务管理列表性能数据 -> 明细数据 -> 快照数据,层层深入快速定位到问题具体发生的位置。

快速入口

> 如何使用性能监控

最后更新:2017-01-03 10:48:57

  上一篇:go 公有镜像中心
  下一篇:go 首次备案