告警管理简介 告警类别和告警 DMS告警源触发阈值告警 告警类别 告警名称 告警级别 告警描述 默认 节点CPU使用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的CPU使用率(系统+用户)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的CPU使用率(系统+用户)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点系统CPU使用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的系统CPU使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的系统CPU使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点系统磁盘使用率超阈值 >85%紧急,>80%重要 DMS告警模块在指定周期内,检测到集群任意节点的系统盘(/)使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的系统盘(/)使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点日志盘使用率超阈值 >85%紧急,>80%重要 DMS告警模块在指定周期内,检测到集群任意节点的日志盘(/var/chroot/DWS/manager)使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的日志盘(/var/chroot/DWS/manager)使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点数据盘使用率超阈值 >85%紧急,>80%重要 DMS告警模块在指定周期内,检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点系统盘I/O利用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的系统盘(/)I/O利用率(util)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的系统盘(/)I/O利用率(util)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点日志盘I/O利用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的日志盘(/var/chroot/DWS/manager)I/O利用率(util)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的日志盘(/var/chroot/DWS/manager)I/O利用率(util)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点数据盘I/O利用率超阈值 紧急 DMS告警模块在指定周期内,检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])I/O利用率(util)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])I/O利用率(util)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点系统盘时延超阈值 重要 DMS告警模块在指定周期内,检测到集群任意节点的系统盘(/)I/O延时(await)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的系统盘(/)I/O延时(await)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点日志盘时延超阈值 重要 DMS告警模块在指定周期内,检测到集群任意节点的日志盘(/var/chroot/DWS/manager)I/O延时(await)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的日志盘(/var/chroot/DWS/manager)I/O延时(await)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点数据盘时延超阈值 重要 DMS告警模块在指定周期内,检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])I/O延时(await)超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])I/O延时(await)低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点系统盘inode使用率超阈值 >95%紧急,>90%重要 DMS告警模块在指定周期内,检测到集群任意节点的系统盘(/)inode使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的系统盘(/)inode使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点日志盘inode使用率超阈值 >95%紧急,>90%重要 DMS告警模块在指定周期内,检测到集群任意节点的日志盘(/var/chroot/DWS/manager)inode使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的日志盘(/var/chroot/DWS/manager)inode使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 节点数据盘inode使用率超阈值 >95%紧急,>90%重要 DMS告警模块在指定周期内,检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])inode使用率超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;检测到集群任意节点的数据盘(/var/chroot/DWS/data[n])inode使用率低于当前设定阈值,且抑制条件不满足时,DMS告警模块将消除该告警。 默认 查询语句触发下盘量超阈值 紧急 DMS告警模块在指定周期内,检测到集群中执行的SQL语句触发结果集下盘,下盘量超过当前设定阈值,且抑制条件不满足时,DMS告警模块将触发该告警;该告警为针对每个SQL语句下盘量的告警,因此无法自动消除,需要用户在处理完该告警所涉及的SQL语句后手动消除该告警项。 默认 查询语句堆积数量超阈值 紧急 DMS告警模块在指定周期内,检测到集群中处于等待状态的SQL语句数量超过当前设定阈值时,DMS告警模块将触发该告警;检测到集群中处于等待状态的SQL语句数量低于当前设定阈值时,DMS告警模块将消除该告警。 默认 集群默认资源池队列阻塞 紧急 DMS告警模块在指定周期内,检测到集群的默认资源池队列发生阻塞,且抑制条件不能满足时,DMS告警模块将触发该告警;检测到集群的默认资源池队列不再发生阻塞,DMS告警模块将消除该告警。 默认 集群的sql探针使用率超阈值 紧急 DMS告警模块在指定周期内,检测到任意集群的某个主机上出现sql探针耗时超过阈值,且抑制条件不能满足时,DMS告警模块将触发该告警;检测到任意集群的某个主机上不再出现sql探针耗时超过阈值时,DMS告警模块将消除该告警。 说明 该告警仅8.1.1.300及以上版本支持,历史版本需要联系技术支持人员升级dmsagent为8.1.3版本后支持。 自定义 用户自定义阈值告警名称 用户自定义告警级别 用户自定义阈值告警描述。