告警管理
更新时间 2025-12-01 15:17:40
最近更新时间: 2025-12-01 15:17:40
本章节介绍ZooKeeper的告警管理功能
概述
通过实例的告警管理能力,您可以对实例状态进行实时监控,并在特定指标异常时,将消息以不同形式(短信、邮件、翼连)推送到相关负责人,以便及时感知问题、处理线上故障。
管理通知对象
在配置告警规则之前,您需要先添加通知对象。通知对象包括联系人、联系人组、翼连、WebHook集成四种形式。
- 联系人:一个告警规则所通知的“个人”,通知渠道包括该“个人”的手机短信和个人邮箱。
- 联系人组:多个联系人组成的逻辑团体。若告警通知到联系人组,将会通知联系人组下的每个联系人。
- 翼连:通知到翼连群。
- WebHook集成:通过调用预先指定的地址进行告警通知。
下面以最简单的联系人为例,演示如何添加通知对象。
1.进入实例引擎控制台->告警管理->通知组页签,点击新建联系人按钮。
2.在弹出的窗口中,填写联系人的对应信息,即可完成创建。
管理告警规则
告警规则决定了一次告警发生的阈值、通知的对象和渠道,以及通知的内容。完成联系人创建后,进入实例引擎控制台->告警管理->告警规则页签,可以管理您的告警规则。
下面将演示如何创建一个“ZooKeeper引擎延迟过大”告警并使其生效,触发告警。
- 创建通知策略。进入实例引擎控制台->告警管理->通知策略页签,点击创建通知策略按钮,填写相关信息,并指定通知对象为上一步骤中创建的联系人,完成通知策略创建;
- 点击创建告警规则按钮,在弹出的窗口中填写告警相关信息。其中,通知策略指定为步骤1中创建的通知策略,告警分组选择“ZooKeeper引擎”,告警指标选择“平均延迟”,根据您的需求选择合适的判断条件,告警等级。
- 完成告警规则创建后,可在告警规则列表中查询到该条目。告警规则创建完毕后默认启用,可通过右侧操作中的停止来使该规则失效。
- 告警规则生效后,可在实例引擎控制台->告警管理->告警事件历史页签中,对告警事件的当前状态进行追踪。