告警列表 本节主要介绍告警列表。 告警规则名称 告警级别 告警条件 自动解除条件 告警失效条件 是否允许手动解除 告警邮件发送频率 数据目录读写错误 PathIOError 重要 数据目录状态为坏盘 数据目录状态为正常 数据目录被移除 数据目录从存储池中移除 数据目录所在服务器被移除 是 每天一次 数据目录所在磁盘写入速度慢 DiskWriteSlow 警告 数据目录所在磁盘写入速度慢 数据目录所在盘恢复正常 数据目录被移除 数据目录从存储池中移除 数据目录所在服务器被移除 是 每天一次 许可证即将到期 LicenseWillExpire 警告 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的到期时间 0天 当前时间(告警模块所在服务器的系统时间)距离告警许可证的到期时间>15天 许可证过期, 导入新的许可证(不同id的许可证) 是 每天一次 许可证过期 LicenseExpired 严重 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的到期时间 0天 导入新的许可证(不同id的许可证) 是 每天一次 许可证维保即将到期 LicenseMaintenanceWillExpire 警告 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的维保到期时间 0天 当前时间(告警模块所在服务器的系统时间)距离告警许可证的维保到期时间>15天 许可证过期 导入新的许可证(不同id的许可证) 是 每天一次 许可证过保 LicenseMaintenanceExpired 警告 当前时间(告警模块所在服务器的系统时间)距离最后导入的许可证的维保到期时间 0天 导入新的许可证 是 每天一次 试用期即将到期 TrialVersionWillExpire 警告 当前未导入生效的许可证,并且当前时间(告警模块所在服务器的系统时间)距离试用期过期时间 0天 无解除条件,只能手动解除 导入新的许可证 是 每天一次 资源用量接近使用上限 ResourceUsageApproachingLimit 重要 本地卷总容量>许可证容量的80% 本地卷总容量 8000 告警条数 80%, 数据目录层级的数据目录关联磁盘的PathCapQuotaRate>80% 说明 数据目录未设置容量配额,则按容量配额磁盘总容量计算。 存储池中数据目录关联磁盘的PathCapQuotaRate 95% 基础存储池中数据目录对应磁盘总配额使用率 95%,或数据目录对应磁盘配额使用率>95% 非基础存储池中数据目录对应磁盘总配额 80%,或数据目录对应磁盘的PathRate>80% 存储池中数据目录对应磁盘的PathRate 5GiB 服务器被移除 是 每天一次 基础服务异常 BaseServiceAbnormal 严重 发生以下任一情况时,分别发出相应告警实例的告警: 元数据管理服务(mdm)异常:集群中stor:mdm服务有2个,仅允许一个故障,故障时发出告警 故障转移控制服务(fc)异常:集群中stor:fc服务有2个,仅允许一个故障,故障时发出告警 日志服务(ls)异常:集群中stor:ls服务有3个,仅允许一个故障,故障时发出告警 协调服务(cs)异常:集群中stor:cs服务有3个,仅允许一个故障,故障时发出告警 匹配的告警实例恢复到以下程度: 元数据管理服务(mdm)在告警机器上恢复正常:告警机器上的stor:mdm服务恢复正常 故障转移控制服务(fc)在告警机器上恢复正常:告警机器上的stor:fc服务恢复正常 日志服务(ls)在告警机器上恢复正常:告警机器上的stor:ls服务恢复正常 协调服务(cs)在告警机器上恢复正常:告警机器上的stor:cs服务恢复正常 告警机器上的基础服务迁移完成 是 每天一次 基础服务数据目录剩余空间不足 InsufficientSpaceonMetaDir 严重 基础服务数据目录所在磁盘的文件系统剩余空间 5GiB 服务开始迁移 是 每天1次 卷数据健康度降级 LUNDataLowRedundancy 警告 卷数据降级的百分比(含缓存池和最终池数据)>10%,持续超过10分钟(10分钟内降级百分比一直低于或等于10%) 卷数据降级的百分比(含缓存池和最终池数据)0% 卷被删除 卷删除失败 是 每天1次 卷数据损坏 LUNDataCorrupted 重要 卷数据Error的百分比(含缓存池和最终池数据)>0% 卷数据Error的百分比(含缓存池和最终池数据)0% 卷被删除 卷删除失败 是 每天1次 存储池数据健康度降级 PoolDataLowRedundancy 重要 基础存储池数据降级的百分比 > 10%,持续超过10分钟(10分钟内降级百分比一直低于或等于10%) 基础存储池数据降级的百分比 0% 存储池名称修改 是 每天1次 存储池数据健康度降级 PoolDataLowRedundancy 警告 普通存储池数据降级的百分比 > 10%,持续超过10分钟(10分钟内降级百分比一直低于或等于10%) 普通存储池数据降级的百分比 0% 存储池名称修改 存储池被删除 是 每天1次 存储池数据损坏 PoolDataCorrupted 严重 基础存储池数据Error的百分比> 0% 基础存储池数据Error的百分比 0% 存储池名称修改 是 每天1次 存储池数据损坏 PoolDataCorrupted 重要 普通存储池数据Error的百分比> 0% 普通存储池数据Error的百分比 0% 存储池名称修改 存储池被删除 是 每天1次