searchusermenu
  • 发布文章
  • 消息中心
点赞
收藏
评论
分享
原创

Prometheus promQL常用查询(二)

2023-08-25 02:04:50
19
0

1. 系统平均负载

Visualization:Graph
Unit:short/none
Metrics:
# 1m 5m 15m cpu avg load
node_load1{instance=~"$node"}
node_load5{instance=~"$node"}
node_load15{instance=~"$node"}

2. 内存大小信息

Visualization:Graph
Unit:bytes
Metrics:
# 总内存
node_memory_MemTotal_bytes{instance=~"$node"}
# 空闲内存
node_memory_MemFree_bytes{instance=~"$node"}
# Slab - 内核用于缓存数据结构以供自己使用的内存(如 inode,dentry 等缓存)
node_memory_Slab_bytes{instance=~"$node"}
# 缓冲区内存Buffers - 块设备(例如硬盘)缓存node_memory_Buffers_bytes{instance=~"$node"}
# 缓存区内存Cache - 频繁访问的文件数据或内容的缓存
node_memory_Cached_bytes{instance=~"$node"}
# 交换分区内存
node_memory_SwapTotal_bytes{instance=~"$node"}
# 交换分区可用内存
node_memory_SwapFree_bytes{instance=~"$node"}
# 可用内存大小
node_memory_MemAvailable_bytes{instance=~"$node"}
# Harware Corrupted - 内核识别为已损坏或不工作的内存量
node_memory_HardwareCorrupted_bytes{instance=~"$node"}

3. 主机网络收发总带宽

Visualization:Graph
Unit:bits/sec
Metrics:
# 进
sum(irate(node_network_receive_bytes_total{instance="$node",device=~'$nic'}[5m])*8)
# 出
sum(irate(node_network_transmit_bytes_total{instance=~"¥node",device=~'$nic'}[5m])*8)

4. 主机网口收发包异常

Visualization:Graph
Unit:short
Metrics:
# rx errors
rate(node_network_receive_errs_total{instance=~'$node',device=~"$nic"} [5m])
# drop包
rate(node_network_receive_drop_total{instance=~'$node',device=~"$nic"} [5m])
# 重传
rate(node_netstat_Tcp_RetransSegs{instance=~'$node'} [5m])
# frame
rate(node_network_receive_frame_total{instance=~'$node',device=~"$nic"} [5m])

5. TCP连接状态

Visualization:Graph
Unit:short
Metrics:
# ESTABLISHED
node_netstat_Tcp_CurrEstab{instance=~'$node'}
# tcp timewait
node_sockstat_TCP_tw{instance=~'$node'}

6. 磁盘IOPS

Visualization:Graph
Unit:short
Metrics
# 读写iops
irate(node_disk_reads_completed_total{instance=~"$node"}[1m])
irate(node_disk_writes_completed_total{instance=~"$node"}[1m])

7. 磁盘读写大小

Visualization:Graph
Unit:bytes
Metrics
irate(node_disk_read_bytes_total{instance=~"$node"}[1m])
irate(node_disk_written_bytes_total{instance=~"$node"}[1m])

8. 磁盘IO时间

Visualization:Graph
Unit:seconds(s)
Metrics
# device io avg time
irate(node_disk_io_time_seconds_total{instance=~"$node"}[1m])
# read io time
rate(node_disk_read_time_seconds_total{instance=~"$node"}[1m])/rate(node_disk_reads_completed_total{instance=~"$node"}[1m])
# write io time
rate(node_disk_write_time_seconds_total{instance=~"$node"}[1m])/rate(node_disk_writes_completed_total{instance=~"$node"}[1m])
0条评论
作者已关闭评论
Mr. 油
89文章数
0粉丝数
Mr. 油
89 文章 | 0 粉丝
原创

Prometheus promQL常用查询(二)

2023-08-25 02:04:50
19
0

1. 系统平均负载

Visualization:Graph
Unit:short/none
Metrics:
# 1m 5m 15m cpu avg load
node_load1{instance=~"$node"}
node_load5{instance=~"$node"}
node_load15{instance=~"$node"}

2. 内存大小信息

Visualization:Graph
Unit:bytes
Metrics:
# 总内存
node_memory_MemTotal_bytes{instance=~"$node"}
# 空闲内存
node_memory_MemFree_bytes{instance=~"$node"}
# Slab - 内核用于缓存数据结构以供自己使用的内存(如 inode,dentry 等缓存)
node_memory_Slab_bytes{instance=~"$node"}
# 缓冲区内存Buffers - 块设备(例如硬盘)缓存node_memory_Buffers_bytes{instance=~"$node"}
# 缓存区内存Cache - 频繁访问的文件数据或内容的缓存
node_memory_Cached_bytes{instance=~"$node"}
# 交换分区内存
node_memory_SwapTotal_bytes{instance=~"$node"}
# 交换分区可用内存
node_memory_SwapFree_bytes{instance=~"$node"}
# 可用内存大小
node_memory_MemAvailable_bytes{instance=~"$node"}
# Harware Corrupted - 内核识别为已损坏或不工作的内存量
node_memory_HardwareCorrupted_bytes{instance=~"$node"}

3. 主机网络收发总带宽

Visualization:Graph
Unit:bits/sec
Metrics:
# 进
sum(irate(node_network_receive_bytes_total{instance="$node",device=~'$nic'}[5m])*8)
# 出
sum(irate(node_network_transmit_bytes_total{instance=~"¥node",device=~'$nic'}[5m])*8)

4. 主机网口收发包异常

Visualization:Graph
Unit:short
Metrics:
# rx errors
rate(node_network_receive_errs_total{instance=~'$node',device=~"$nic"} [5m])
# drop包
rate(node_network_receive_drop_total{instance=~'$node',device=~"$nic"} [5m])
# 重传
rate(node_netstat_Tcp_RetransSegs{instance=~'$node'} [5m])
# frame
rate(node_network_receive_frame_total{instance=~'$node',device=~"$nic"} [5m])

5. TCP连接状态

Visualization:Graph
Unit:short
Metrics:
# ESTABLISHED
node_netstat_Tcp_CurrEstab{instance=~'$node'}
# tcp timewait
node_sockstat_TCP_tw{instance=~'$node'}

6. 磁盘IOPS

Visualization:Graph
Unit:short
Metrics
# 读写iops
irate(node_disk_reads_completed_total{instance=~"$node"}[1m])
irate(node_disk_writes_completed_total{instance=~"$node"}[1m])

7. 磁盘读写大小

Visualization:Graph
Unit:bytes
Metrics
irate(node_disk_read_bytes_total{instance=~"$node"}[1m])
irate(node_disk_written_bytes_total{instance=~"$node"}[1m])

8. 磁盘IO时间

Visualization:Graph
Unit:seconds(s)
Metrics
# device io avg time
irate(node_disk_io_time_seconds_total{instance=~"$node"}[1m])
# read io time
rate(node_disk_read_time_seconds_total{instance=~"$node"}[1m])/rate(node_disk_reads_completed_total{instance=~"$node"}[1m])
# write io time
rate(node_disk_write_time_seconds_total{instance=~"$node"}[1m])/rate(node_disk_writes_completed_total{instance=~"$node"}[1m])
文章来自个人专栏
文章 | 订阅
0条评论
作者已关闭评论
作者已关闭评论
0
0