告警管理能力当前已全面升级,本文以Prometheus监控上报告警,并发送告警通知到企业微信群为例,帮助您快速使用告警管理功能,从创建告警、配置联系人到接收到第一条告警消息。
步骤一:创建通知对象
告警管理支持将告警通知通过短信、电话、邮件、企业微信等方式发送给通知对象。此处以创建企业微信群为例,展示如何通过告警管理中的机器人向您指定的企业微信群发送告警通知。创建其他通知对象的操作,请参见【通知对象】。
登录应用性能监控控制台,在左侧导航栏选择告警管理 > 通知对象。
单击 钉钉/飞书/企微页签,然后单击企微。
在新建机器人面板设置以下参数,然后单击确定。
参数 说明 名称 自定义企业微信机器人的名称。 机器人地址 输入企业微信机器人的Webhook地址。 告警模板 可编辑告警模板内容,告警触发时将根据模板内容进行发送。 恢复模板 可编辑告警模板内容,告警恢复时将根据模板内容进行发送。
步骤二:创建通知策略
此处展示如何将所有告警事件中告警等级为紧急的告警事件合并为一条告警通知发送至企业微信群中。更多信息,请参见【通知策略】。
登录应用性能监控控制台,在左侧导航栏选择告警管理 > 通知策略。
在通知策略页面单击新建通知策略。并选择下方高级设置。
在新建通知策略页面设置通知策略名称。
在匹配规则区域设置告警事件的匹配规则。(静默策略优先于通知策略,即已被静默策略匹配到的告警事件将会被静默,无法再进行通知策略的事件匹配。)
选择无预设来源。通知策略会针对所有告警事件进行匹配规则过滤并发送通知。
设置匹配规则表达式,您可以自定义标签或选择已有的标签。例如:_ctyun_arms_alert_level等于4。
单击下一步。
在事件分组区域,设置告警事件不需要分组,然后单击下一步。
在通知对象区域,设置以下参数。
选择通知对象为钉钉/飞书/企微,并选择上文【步骤一】创建的企业微信机器人。
选择告警恢复后是否发送恢复通知。
发送恢复通知:当告警下面全部事件都恢复时,告警状态是否自动恢复为已解决。当告警恢复时,系统将会发送通知给告警处理人。
设置通知时段,告警会在设置的通知时段内发送告警通知例如:通知时段为。00:00-23:59。
单击下一步。
在重复/升级策略区域设置告警是否需要重复通知或使用升级策略。
不需要升级策略,告警未恢复状态下只发送一次。
重复通知:设置重复频率。当告警未恢复时,告警会以设置的重复频率循环发送告警信息直至告警恢复。
升级策略:选择升级策略,告警未恢复状态下,告警通知将会根据升级策略发送通知给其他通知对象。
设置完成后,单击保存。
步骤三:创建告警
Prometheus监控创建告警的操作,请参见【创建Prometheus告警规则】。
步骤四:查看告警
当触发告警规则条件时,即可在企业微信群中的告警卡片中查看告警的基本信息。