云主机支持的操作系统监控指标(安装监控Agent) GPU相关监控指标 监控指标 监控指标名称 监控指标含义 单位(原始数据) 维度 监控周期 显存使用率 memusageongpu GPU云主机显存使用率。 英伟达:通过nvidiasmi获取。 昇腾: 通过npusmi获取。 % 云主机GPU 1分钟 GPU使用率 gpuutilongpu GPU使用率。 英伟达:通过nvidiasmi获取。 昇腾: 通过npusmi获取。 % 云主机GPU 1分钟 显卡功率 npuchipinfopower GPU功率。 英伟达:通过nvidiasmi获取。 昇腾: 通过npusmi获取。 W 云主机GPU 1分钟 显卡温度 npuchipinfotemperature GPU卡温度。 英伟达:通过nvidiasmi获取。 昇腾: 通过npusmi获取。 ℃ 云主机GPU 1分钟 显存使用量 npuchipinfousedmemory GPU显存使用量。 英伟达:通过nvidiasmi获取。 昇腾: 通过npusmi获取。 byte 云主机GPU 1分钟 说明 在GPU监控中,当出现以下异常数值时,可能表示监控数据采集存在异常: NPU 利用率显示为 4,290,000,000 GPU 利用率显示为 1,020,000,000 此类数值可能由驱动兼容性或系统状态异常引起,建议检查设备驱动状态或收集系统日志后提交工单解决。