云主机支持的操作系统监控指标(安装监控Agent)
更新时间 2026-01-28 17:43:20
最近更新时间: 2026-01-28 17:43:20
前提条件
请确保您的云主机上已成功安装监控Agent。具体操作,请参见安装监控Agent。
监控指标说明
安装监控Agent后,您可以查看不同分类的操作系统监控指标,采集频率均为1分钟/次。
操作系统监控指标已支持:CPU相关监控指标、内存相关监控指标、CPU负载相关监控指标、磁盘相关监控指标、磁盘I/O相关监控指标、文件系统相关监控项、网络相关监控项、GPU相关监控指标。
CPU相关监控指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位 | 维度 | 监控周期 |
|---|---|---|---|---|---|
| CPU使用率 | cpu_util | 采集周期内云主机实时占用的 CPU 百分比。 - Linux:通过读取系统/proc/stat计算得出。 - Windows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| 用户空间CPU使用率 | cpu_user_time | 采集周期内云主机用户空间占用CPU使用率。 - Linux:通过读取系统/proc/stat计算得出。 -indows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| 内核空间CPU使用率 | cpu_system_time | 采集周期内云主机内核空间占用CPU使用率。 - Linux:通过读取系统/proc/stat计算得出。 - indows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| 其他CPU使用率 | other_cpu_util | 采集周期内云主机其他占用CPU使用率。 通过“其他CPU使用率1- 空闲CPU使用率- 内核空间CPU使用率- 用户空间CPU使用率” 计算得出。 |
% | 云主机 | 1分钟 |
| CPU空闲时间占比 | cpu_idle_time | 采集周期内云主机CPU空闲时间占比。 - Linux:通过读取系统/proc/stat计算得出。 - Windows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| Nice进程CPU使用率 | cpu_nice_time | 采集周期内云主机Nice进程CPU使用率。 - Linux:通过读取系统/proc/stat计算得出。 - Windows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| iowait状态占比 | cpu_iowait_time | 采集周期内云主机iowait状态占用CPU的比率。 - Linux:通过读取系统/proc/stat计算得出。 - WWindows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| CPU中断时间占比 | cpu_interrupt_time | 采集周期内云主机CPU处理中断用时占用CPU时间的百分比。 - Linux:通过读取系统/proc/stat计算得出。 - Windows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
| CPU软中断时间占比 | cpu_softirq_time | 采集周期内云主机CPU处理软中断时间占用CPU时间的百分比。 - Linux:通过读取系统/proc/stat计算得出。 - Windows:通过 GetSystemTimes获取。 |
% | 云主机 | 1分钟 |
内存相关监控指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 内存使用率 | mem_util | 采集周期内云主机内存使用率。 - Linux:通过/proc/meminfo获得, ·当系统内有MemAvailable时,内存使用率=(MemTotal-MemAvailable)/MemTotal ·当系统内无MemAvailable时,内存使用率=(MemTotal-MemFree-Buffers-Cached)/MemTotal - Windows:通过GlobalMemoryStatusEx函数获取,内存使用率=Mem_used/Mem_total |
% | 云主机 | 1分钟 |
| 可用内存 | free_memory | 云主机可用内存。 - Linux:通过/proc/meminfo获得。 - Windows:通过GlobalMemoryStatusEx函数获取。 |
byte | 云主机 | 1分钟 |
| 已用内存量 | used_memory | 云主机已使用内存量。 - Linux:通过/proc/meminfo获得。 - Windows:通过GlobalMemoryStatusEx函数获取。 |
byte | 云主机 | 1分钟 |
| Buffers占用量 | buffer_memory | 云主机Buffers内存量。 - Linux:通过/proc/meminfo获得。 仅Linux支持,通过/proc/meminfo获得。 |
byte | 云主机 | 1分钟 |
| Cached占用量 | cache_memory | 云主机Cache内存量。 仅Linux支持,通过/proc/meminfo获得。 |
byte | 云主机 | 1分钟 |
| 物理内存使用量 | actual_used_memory | 云主机物理内存使用量。 - Linux:通过/proc/meminfo获得, ·当系统内有MemAvailable时,物理内存使用量=MemTotal-MemAvailable ·当系统内无MemAvailable时,物理内存使用量=MemTotal-MemFree-Buffers-Cached - Windows:通过GlobalMemoryStatusEx函数获取,Mem_used |
byte | 云主机 | 1分钟 |
CPU负载相关指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 1分钟平均负载 | processor_load_1_min_average_per_core | 采集周期内云主机过去1分钟的系统平均负载。 - Linux:通过读取 /proc/loadavg 文件计算得出。 - Windows:系统通过 WMI 接口获取。 |
无 | 云主机 | 1分钟 |
| 5分钟平均负载 | processor_load_5_min_average_per_core | 采集周期内云主机过去5分钟的系统平均负载。 - Linux:通过读取 /proc/loadavg 文件计算得出。 - Windows:系统通过 WMI 接口获取。 |
无 | 云主机 | 1分钟 |
| 15分钟平均负载 | processor_load_15_min_average_per_core | 采集周期内云主机过去15分钟的系统平均负载。 - Linux:通过读取 /proc/loadavg 文件计算得出。 - Windows:系统通过 WMI 接口获取。 |
无 | 云主机 | 1分钟 |
磁盘相关指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 磁盘分配率 | disk_util_inband | 磁盘使用率。 通过 磁盘分配率=已用磁盘空间/磁盘总空间容量 计算得出。 - Linux:等价于通过 df 命令获取挂载点磁盘空间数据。 - Windows:通过 WMI 接口GetDiskFreeSpaceExW函数获取。 |
% | 云主机-挂载点 | 1分钟 |
| 磁盘已用存储量 | used_disk_space_on | 磁盘的已用存储空间。 - Linux:等价于通过 df 命令获取挂载点磁盘空间数据。 - Windows:通过 WMI 接口GetDiskFreeSpaceExW函数获取。 |
byte | 云主机-挂载点 | 1分钟 |
| 磁盘剩余存储量 | free_disk_space_on | 磁盘的剩余存储空间。 - Linux:等价于通过 df 命令获取挂载点磁盘空间数据。 - Windows:通过 WMI 接口GetDiskFreeSpaceExW函数获取。 |
byte | 云主机-挂载点 | 1分钟 |
| 磁盘存储总量 | total_disk_space_on | 磁盘存储总量。 - Linux:等价于通过 df 命令获取挂载点磁盘空间数据。 - Windows:通过 WMI 接口GetDiskFreeSpaceExW函数获取。 |
byte | 云主机-挂载点 | 1分钟 |
磁盘I/O相关指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 磁盘读速率 | disk_read_bytes_rate | 采集周期内云主机从磁盘每秒读取的数据量。 - Linux:通过获取/proc/diskstats获取。 - Windows:通过WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk获取数据计算得出。 |
KB/s | 云主机-磁盘 | 1分钟 |
| 磁盘读请求速率 | disk_read_requests_rate | 采集周期内云主机从磁盘每秒读请求次数。 - Linux:通过获取/proc/diskstats获取。 - Windows:通过WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk获取数据计算得出。 |
次/s | 云主机-磁盘 | 1分钟 |
| 磁盘写速率 | disk_write_bytes_rate | 采集周期内云主机向磁盘每秒写入的数据量。 - Linux:通过获取/proc/diskstats获取。 - Windows:通过WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk获取数据计算得出。 |
KB/s | 云主机-磁盘 | 1分钟 |
| 磁盘写请求速率 | disk_write_requests_rate | 采集周期内云主机向磁盘每秒写请求次数。 - Linux:通过获取/proc/diskstats获取。 - Windows:通过WMI中Win32_PerfFormattedData_PerfDisk_LogicalDisk获取数据计算得出。 |
次/s | 云主机-磁盘 | 1分钟 |
文件系统操作指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| inode空间大小 | total_inode_on | inode空间大小。 仅Linux支持,等价于通过df -i命令,查看inodes空间数据。 |
files | 云主机-挂载点 | 1分钟 |
| inode已使用空间 | used_inode_on | 已使用的inode空间。 仅Linux支持,等价于通过df -i命令,查看iused空间数据。 |
files | 云主机-挂载点 | 1分钟 |
| inode已使用占比 | pused_inode_on_percentage | 已使用的inode占比。 仅Linux支持,等价于通过df -i命令,查看iused%数据。 |
% | 云主机-挂载点 | 1分钟 |
网络相关监控指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 入网带宽 | incoming_network_traffic_on | 采集周期内云主机网卡每秒接收的数据量。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
bit/s | 云主机-网卡 | 1分钟 |
| 出网带宽 | outgoing_network_traffic_on | 采集周期内云主机网卡每秒发送的数据量。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
bit/s | 云主机-网卡 | 1分钟 |
| 网卡包接收的速率 | incoming_network_traffic_packets_on | 采集周期内云主机网卡每秒接收的数据包数量。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
个/s | 云主机-网卡 | 1分钟 |
| 网卡包发送的速率 | outgoing_network_traffic_packets_on | 采集周期内云主机网卡每秒发送的数据包数量。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
个/s | 云主机-网卡 | 1分钟 |
| 接收丢包率 | network_incoming_drop_rate_inband | 采集周期内云主机内网每秒接收并已丢弃的数据包数量占所接收的数据包的比率。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
% | 云主机 | 1分钟 |
| 发送丢包率 | network_outing_drop_rate_inband | 采集周期内云主机内网每秒发送并已丢弃的数据包数量占所发送的数据包的比率。 - Linux:通过获取/proc/net/dev数据计算变化量得出。 - Windows:通过WMI中MibIfRow获取。 |
% | 云主机 | 1分钟 |
| TCP连接总数 | net_tcp_total | 采集周期内云主机内所有状态的TCP连接总数。 - Linux:通过/proc/net/tcp所有状态的TCP连接数后计算总和得出。 - Windows:通过GetTcpTable2函数获取。 |
个 | 云主机 | 1分钟 |
| ESTABLISHED TCP连接数 | net_tcp_established | 采集周期内云主机内ESTABLISHED状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| SYS_SENTTCP连接数 | net_tcp_syn_sent | 采集周期内云主机内SYS_SENT状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| SYS_RECVTCP连接数 | net_tcp_syn_recv | 采集周期内云主机内SYS_RECV状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| FIN_WAIT1TCP连接数 | net_tcp_fin_wait1 | 采集周期内云主机内FIN_WAIT1状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| FIN_WAIT2TCP连接数 | net_tcp_fin_wait2 | 采集周期内云主机内FIN_WAIT2状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| TIME_WAIT TCP连接数 | net_tcp_time_wait | 采集周期内云主机内TIME_WAIT状态的TCP连接数量 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| CLOSE_TCP连接数 | net_tcp_close | 采集周期内云主机内CLOSE状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| CLOSE_WAITTCP连接数 | net_tcp_close_wait | 采集周期内云主机内CLOSE_WAIT状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| LAST_ACKTCP连接数 | net_tcp_last_ack | 采集周期内云主机内LAST_ACK状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| LISTEN_TCP连接数 | net_tcp_listen | 采集周期内云主机内LISTEN状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
| CLOSING_TCP连接数 | net_tcp_closing | 采集周期内云主机内CLOSING状态的TCP连接数量。 - Linux:通过/proc/net/tcp获取对应状态的TCP连接数。 - Windows:通过GetTcpTable2函数获 |
个 | 云主机 | 1分钟 |
进程相关监控指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 运行中进程数 | proc_num | 云主机内处于运行状态的进程数量。 - Linux:通过获取 /proc/pid/status 中对应状态的进程数量。 |
个 | 云主机 | 1分钟 |
| 僵死进程数 | zomb_num | 云主机内处于僵死的进程数量,仅Linux操作系统支持。 - Linux:通过获取/proc/pid/status 中对应状态的进程数量。 |
个 | 云主机 | 1分钟 |
| 睡眠进程数 | sleep_num | 云主机内处于睡眠状态的进程数量,仅Linux操作系统支持。 - Linux:通过获取/proc/pid/status 中对应状态的进程数量。 |
个 | 云主机 | 1分钟 |
| 指定进程数量 | process_number | 云主机内指定进程数量。 - Linux:通过获取 /proc/pid/status 中匹配进程名称关键字得出。 |
个 | 云主机-进程 | 1分钟 |
| 进程CPU使用率 | process_cpu_util | 采集周期内,CPU使用率TOP5的进程消耗的CPU百分比。 - Linux:通过获取 /proc/pid/status 中计算变化率得出。 |
% | 云主机-进程 | 1分钟 |
| 进程内存使用率 | process_mem_util | 采集周期内,CPU使用率TOP5的进程消耗的内存百分比。 - Linux:通过计算RSS*PAGESIZE/MemTotal得出。 |
% | 云主机-进程 | 1分钟 |
| 进程打开文件数 | process_open_files | 采集周期内,CPU使用率TOP5的进程打开的文件数。 - Linux:通过 /proc/pid/fd 统计得出。 |
个 | 云主机-进程 | 1分钟 |
GPU相关监控指标
| 监控指标 | 监控指标名称 | 监控指标含义 | 单位(原始数据) | 维度 | 监控周期 |
|---|---|---|---|---|---|
| 显存使用率 | memusage_on_gpu | GPU云主机显存使用率。 - 英伟达:通过nvidia-smi获取。 - 昇腾: 通过npu-smi获取。 |
% | 云主机-GPU | 1分钟 |
| GPU使用率 | gpuutil_on_gpu | GPU使用率。 - 英伟达:通过nvidia-smi获取。 - 昇腾: 通过npu-smi获取。 |
% | 云主机-GPU | 1分钟 |
| 显卡功率 | npu_chip_info_power | GPU功率。 - 英伟达:通过nvidia-smi获取。 - 昇腾: 通过npu-smi获取。 |
W | 云主机-GPU | 1分钟 |
| 显卡温度 | npu_chip_info_temperature | GPU卡温度。 - 英伟达:通过nvidia-smi获取。 - 昇腾: 通过npu-smi获取。 |
℃ | 云主机-GPU | 1分钟 |
| 显存使用量 | npu_chip_info_used_memory | GPU显存使用量。 - 英伟达:通过nvidia-smi获取。 - 昇腾: 通过npu-smi获取。 |
byte | 云主机-GPU | 1分钟 |
说明在GPU监控中,当出现以下异常数值时,可能表示监控数据采集存在异常:
- NPU 利用率显示为 4,290,000,000
- GPU 利用率显示为 1,020,000,000此类数值可能由驱动兼容性或系统状态异常引起,建议检查设备驱动状态或收集系统日志后提交工单解决。