945
阿里云
监控项说明__主机监控_用户指南_云监控-阿里云
监控项说明
主机监控的监控项分为插件采集的监控项和ECS 原生自带的监控项两部分,插件采集频率为15秒一次,ECS 基础监控数据采集频率为1分钟1次。
插件采集指标
CPU 相关监控项
以下为CPU使用率相关监控指标,可参考Linux的top命令来理解各项指标含义。
监控项名称 |
监控项含义 |
单位 |
说明 |
---|
Host.cpu.idle |
当前空闲CPU百分比 |
% |
Host.cpu.system |
当前内核空间占用CPU百分比 |
% |
指系统上下文切换的消耗,该监控项数值比较高,说明服务器开了太多的进程或者线程 |
Host.cpu.user |
当前用户空间占用CPU百分比 |
% |
用户进程对CPU的消耗 |
Host.cpu.iowait |
当前等待IO操作的CPU百分比 |
% |
该项数值比较高说明有很频繁的IO操作 |
Host.cpu.other |
其他占用CUP百分比 |
% |
其他消耗,计算方式为(Nice + SoftIrq + Irq + Stolen)的消耗 |
Host.cpu.total |
当前消耗的总CPU百分比 |
% |
指以上各项CPU消耗的总和,通常用于报警 |
内存相关监控项
以下为内存相关监控项,可参考free命令来理解各项指标含义。
监控项名称 |
监控项含义 |
单位 |
说明 |
---|
Host.mem.total |
内存总量 |
bytes |
服务器的内存总量 |
Host.mem.used |
已用内存量 |
bytes |
用户程序使用的内存 + buffers + cached,buffers为缓冲区占用的内存空间,cached为系统缓存占用的内存空间 |
Host.mem.actualused |
用户实际使用的内存 |
bytes |
计算方法为(used - buffers - cached) |
Host.mem.free |
剩余内存量 |
bytes |
计算方法为(内存总量-已用内存量) |
Host.mem.freeutilization |
剩余内存百分比 |
% |
计算方法为(剩余内存量/内存总量*100%) |
Host.mem.usedutilization |
内存使用率 |
% |
计算方法为( Actual used/total*100%) |
系统平均负载监控项
以下为系统平均负载相关监控项,可参考Linux top命令来理解各项指标含义。监控项数值越高代表系统越繁忙。
监控项名称 |
监控项含义 |
单位 |
---|
Host.load1 |
过去1分钟的系统平均负载,Windows操作系统没有此指标 |
无 |
Host.load5 |
过去5分钟的系统平均负载,Windows操作系统没有此指标 |
无 |
Host.load15 |
过去15分钟的系统平均负载,Windows操作系统没有此指标 |
无 |
磁盘相关监控项
- 磁盘使用率与inode使用率可参考Linux df命令。
- 磁盘读写指标可参考Linux iostat命令。
监控项名称 |
监控项含义 |
单位 |
---|
Host.diskusage.used |
磁盘的已用存储空间 |
bytes |
Host.disk.utilization |
磁盘使用率 |
% |
Host.diskusage.free |
磁盘的剩余存储空间 |
bytes/s |
Host.diskussage.total |
磁盘存储总量 |
bytes |
Host.disk.readbytes |
磁盘每秒读取的字节数 |
bytes/s |
Host.disk.writebytes |
磁盘每秒写入的字节数 |
bytes/s |
Host.disk.readiops |
磁盘每秒的读请求数量 |
次/秒 |
Host.disk.writeiops |
磁盘每秒的写请求数量 |
次/秒 |
文件系统监控项
监控项名称 |
监控项含义 |
单位 |
说明 |
---|
Host.fs.inode |
inode使用率,UNIX/Linux系统内部使用inode号码来识别文件,磁盘还未存满,但inode已经分配完时会出现无法在磁盘新建文件的情况,Windows操作系统没有此指标 |
% |
inode数量代表文件系统文件数量,大量小文件会导致inode使用率过高 |
网络相关监控项
- 以下为网络相关指标,可参考Linux iftop。TCP连接数的采集,可参考Linux ss命令。
- TCP连接数会默认采集 TCP_TOTAL(总连接数)、ESTABLISHED(正常连接状态),NON_ESTABLISHED(非连接的状态连接数,ESTABLISHED以外的所有状态),如果您需要获取各个状态连接数的数量,请按如下说明操作:
Linux操作系统
您可以将cloudmonitor/config/conf.properties配置文件的netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
Windows操作系统
您可以在C:”Program Files”Alibabacloudmonitorconfig的配置文件中,将netstat.tcp.disable改为false来开启采集。修改配置后请重启Agent。
监控项名称 |
监控项含义 |
单位 |
---|
Host.netin.rate |
网卡每秒接收的比特数,即网卡的上行带宽 |
bits/s |
Host.netout.rate |
网卡每秒发送的比特数,即网卡的下行带宽 |
bits/s |
Host.netin.packages |
网卡每秒接收的数据包数 |
个/秒 |
Host.netout.packages |
网卡每秒发送的数据包数 |
个/秒 |
Host.netin.errorpackage |
设备驱动器检测到的接收错误包的数量 |
个/秒 |
Host.netout.errorpackages |
设备驱动器检测到的发送错误包的数量 |
个/秒 |
Host.tcpconnection |
各种状态下的TCP连接数包括LISTEN、SYN_SENT、ESTABLISHED、SYN_RECV、FIN_WAIT1、CLOSE_WAIT、FIN_WAIT2、LAST_ACK、TIME_WAIT、CLOSING、CLOSED |
个 |
进程相关监控项
- 进程的CPU使用率、内存使用率可参考Linux top命令,CPU使用率为多核使用情况。
- Host.process.openfile 可参考Linux lsof命令。
- Host.process.number 可参考Linux ps aux |grep ‘关键字’ 命令。
监控项名称 |
监控项含义 |
单位 |
---|
Host.process.cpu |
某个进程消耗的CPU百分比 |
% |
Host.process.memory |
某个进程消耗的内存百分比 |
% |
Host.process.openfile |
当前进程打开文件数 |
个 |
Host.process.number |
指定关键字的进程数 |
个 |
ECS自带监控项
如果您的主机是ECS服务器,以下监控项为购买ECS后,不需要安装插件就可以提供的监控项。指标采集粒度为1分钟。
监控项名称 |
监控项含义 |
单位 |
---|
ECS.CPUUtilization |
CPU使用率 |
% |
ECS.InternetInRate |
公网入流量平均速率 |
bits/s |
ECS.IntranetInRate |
私网入流量平均速率 |
bits/s |
ECS.InternetOutRate |
公网出流量平均速率 |
bits/s |
ECS.IntranetOutRate |
私网出流量平均速率 |
bits/s |
ECS.SystemDiskReadbps |
系统磁盘每秒读取比特总数 |
bits/s |
ECS.SystemDiskWritebps |
系统磁盘每秒写入比特总数 |
bits/s |
ECS.SystemDiskReadOps |
系统磁盘每秒读取次数 |
个/秒 |
ECS.SystemDiskWriteOps |
系统磁盘每秒写入次数 |
个/秒 |
ECS.InternetIn |
公网流入流量 |
bytes |
ECS.InternetOut |
公网流出流量 |
bytes |
ECS.IntranetIn |
内网流入流量 |
bytes |
ECS.IntranetOut |
内网流出流量 |
bytes |
最后更新:2016-11-28 14:58:09