阅读728 返回首页    go 阿里云


负载均衡监控__云服务监控_用户指南_云监控-阿里云

云监控通过监控Sever Load Balancer的流入流量、流出流量等7个监控项,为用户展示SLB的运行状态,帮助用户监测实例的运行状态,并支持用户对监控项设置报警规则。用户创建SLB实例后云监控会自动对上述监控项收集数据。

监控服务

监控项说明

监控项 含义 维度 单位 最小监控粒度
流入流量 从外部访问SLB所需要消耗的流量 实例 bps 1分钟
流出流量 SLB访问外部所需要消耗的流量 实例 bps 1分钟
流入数据包数 SLB每秒接到的请求数据包数量 实例 个数每秒 1分钟
流出数据包数 SLB每秒发出的数据包数量 实例 个数每秒 1分钟
新建连接数 统计周期内TCP三次握手的第一次SYN_SENT状态的数量 实例 个数 1分钟
活跃连接数 当时所有ESTABLISHED状态的连接 实例 个数 1分钟
非活跃连接数 指除established状态的其他所有状态tcp连接数 实例 个数 1分钟

注意事项

  • 新建连接数、活跃连接数、非活跃连接数统计的均是客户端到SLB的TPC连接请求。

查看监控数据

  1. 登录云监控控制台。
  2. 进入“云服务监控”下的“负载均衡”实例列表。
  3. 点击实例名称或“操作”中的“监控图表”,进入监控详情页面。
  4. 点击大小图切换按钮,切换大图显示(可选)。

报警服务

参数说明

  • 监控项:负载均衡提供的监控指标。
  • 统计周期:报警系统会按照这个周期检查您对应的监控数据是否超过了报警阈值。例如设置内存使用率报警规则的统计周期为1分钟,则每间隔1分钟会检查一次内存使用率是否超过了阈值。
  • 统计方法:统计方法指对超出阈值范围的设置。统计方法中可以设置平均值、最大值、最小值、求和值。

    a. 平均值:统计周期内监控数据的平均值。统计结果是15分钟内采集的所有监控数据的平均值,当这个平均值大于80%时,才算超过阈值。

    b. 最大值:统计周期内监控数据的最大值。统计周期内采集的监控数据中,最大值超过80%,即为超过阈值。

    c. 最小值:统计周期内监控数据的最小值。统计周期内采集的监控数据中,最小值超过80%,即为超过阈值。

    d. 求和值:统计周期内监控数据的总和。对统计周期内采集的监控数据进行求和,求和后的结果超过80%即为超过阈值。流量类指标需要用到此类统计方法。

  • 连续几次超过阈值后报警:指连续几个统计周期监控项的值持续超过阈值后触发报警。

    例如:设置CPU使用率超过80%报警,统计周期为5分钟,连续3次超过阈值后报警,则第一次探测CPU使用率超过80%时,不会发出报警通知。5分钟后第二次探测CPU使用率超过80%,也不会发出报警。第三次探测仍然超过80%时,才会发出报警通知。即从实际数据第一次超过阈值到最终发出报警规则,最少需要消耗的时间为统计周期(连续探测次数-1)=5(3-1)=10分钟。

设置报警规则

  1. 登录云监控控制台。
  2. 进入“云服务监控”下的“负载均衡”实例列表。
  3. 点击实例列表“操作”中的“报警规则”,进入实例的报警规则页面。
  4. 点击报警规则页面右上角的“新建报警规则”,根据参数创建一条报警规则。

最后更新:2016-11-23 17:16:05

  上一篇:go 云数据库RDS监控__云服务监控_用户指南_云监控-阿里云
  下一篇:go 对象存储OSS监控__云服务监控_用户指南_云监控-阿里云