Prometheus告警规则模板 您可以通过Prometheus告警规则模板功能来统一管理分布在不同地域的多个Prometheus实例的告警规则。本文介绍如何创建和管理Prometheus告警规则模板。 创建Prometheus告警规则模板 1. 登录应用性能监控APM控制台,点击左侧菜单栏Prometheus监控。 2. 在Prometheus监控菜单下,点击告警规则模板页面。 3. 在页面左上角点击创建告警规则模板按钮。 4. 在创建告警规则模板页面,根据以下参数说明进行设置。您可以选择通过静态阈值或自定义PromQL创建Prometheus告警规则模板。 静态阈值检查类型 静态阈值检查类型提供了系统预设的告警指标,通过选择已有的告警指标,您可以通过语义化的方式快速创建对应指标项的告警规则。 参数 说明 示例 告警规则模板名称 自定义告警规则模板的名称 测试集群容器CPU使用率告警 告警规则模板描述 输入该模板的备注描述信息,可以用于记录模板的含义、适用场景等。 检测类型 选择静态阈值。 静态阈值 告警分组 选择告警分组,不同的告警分组包含不同的告警指标。 Kubernetes负载 告警指标 选择需要进行监控告警的指标,每个告警分组包含不同的指标。 Pod磁盘使用率 告警条件 基于告警指标预置内容,设置告警事件产生条件,如比较符与阈值。 当Pod磁盘使用率>80时,满足告警条件。 持续时间 当告警条件满足时,直接产生告警事件:任何一个数据点满足阈值,就会产生告警事件。 当告警条件满足持续N分钟时,才产生告警事件:即只有当满足阈值的时间大于等于N分钟时,才产生告警事件。 告警等级 自定义告警等级。告警严重程度从一般,次要,重要,紧急逐级上升。 一般 告警内容 用户收到的告警信息。您可以使用Go template语法在告警内容中自定义告警参数变量。 命名空间:{{$labels.namespace}} / Pod: {{$labels.podname}} / 容器:{{$labels.container}} CPU使用率{{$labels.metricsparamsoptlabelvalue}} {{$labels.metricsparamsvalue}}%, 当前值{{ printf "%.2f" $value }}% 通知策略 不指定通知规则:若勾选该选项,在告警规则创建完成后,您可在通知策略界面新建策略,并通过设置匹配规则与匹配条件(例如告警规则名称)关联对应告警规则。当此告警规则触发并生成告警事件时,系统会将告警信息推送至通知策略中指定的联系人或联系人组。更多相关说明,可参考通知策略文档。 指定某个通知策略:若选择此项,系统会自动在对应的通知策略中添加一条匹配规则,匹配规则内容为告警规则ID(以告警规则名称的方式呈现),以确保当前告警规则产生的告警事件一定可以被选择的通知策略匹配到。 高级设置 标签 设置告警标签,设置的标签可用作通知策略匹配规则的选项。 无