告警类型有哪些
基础监控:
告警内容 | 说明 | 处理建议 | 推送方式 |
---|---|---|---|
ping不可达 | ping服务器往目标机器的每个IP各发10个ping包,如果服务器没有收到任何目标机器IP返回的数据包,则发出ping不可达告警。(用户主动关机或到期隔离不会触发此告警) | 1、请确认是否云服务器有禁PING设置; 2、在云服务器控制台查看云主机状态,可以尝试重启设备,观察是否恢复。 |
短信,邮件 |
硬盘分区/** 只读 | 在机器每一个分区生成一个临时文件,如果失败,则发出只读告警。 (/**代表硬盘分区的名称。) |
请重启设备尝试恢复。如果任然有问题,请提交工单联系我们。 | 短信,邮件 |
硬盘使用率预警/告警 | 检查磁盘分区的已使用空间,当已使用空间大于等于90%,且磁盘剩余空间小于5G时,触发告警。 | 请登录设备,及时对相应分区进行硬盘清理。 | 邮件 |
CPU持续高负载 | 云服务器的CPU利用率持续30分钟大于95%。 | 登录服务器查看服务器上运行的进程使用CPU的情况,检查是否有进程运行异常,并对异常进程进行处理。
如果仍然有问题,请提交工单联系我们。 |
邮件 |
内存不足告警 | 分析swap_in和swap_out,有一个指标超过20,并且持续15分钟触发告警。
只有当swap_in和swap_out的值为0时,才判断为告警恢复 |
机器内存不够用。请查看是否有进程存在内存泄漏,或者内存使用不当。
您可能需要了解如何查看单个进程占用的内存大小? |
邮件 |
云数据库连接使用率告警 | 云数据库的连接使用率超过95%,发出告警。云数据库的连接使用率达到100%后,会导致新的云数据库连接失败。
当连接使用率低于90%,告警恢复。 |
如果发生告警,请检查程序中创建的数据库连接是否达到实例的最大连接数,或是否有无用的连接未及时关闭导致连接被耗光,及时关闭没用的连接,使连接使用率低于90%。
连接使用率的查看方法详见云数据库监控指标说明。 |
短信,邮件 |
设备重启告警 | 云服务器因异常导致重启。 | 云服务器重启后,请检查服务器上的程序是否启动,如果未启动,需要开发者手动启动相应程序。 | 短信,邮件 |
服务可用率告警 | 开发者在云拨测中,配置拨测任务时会配置告警方案,当实际可用率低于告警方案中配置的值,且持续时间长于配置的值时,会产生服务可用率告警。 | 请检查拨测的服务是否正常。 | 短信,邮件 |
云数据库磁盘空间使用率告警 | 云数据库空间使用率超过90%就会触发告警。 | 1、删除部分数据,释放空间,如果是innodb的话还需要整理表空间的操作。 2、升级实例到更高规格 |
短信,邮件 |
外网带宽使用率告警 | 检查外网带宽的已使用量,当已使用带宽大于等于90%,且持续30分钟,触发告警。 | 请登录设备,查看机器带宽是否正常。 | 邮件 |
最后更新:2017-01-09 21:51:43