创建Prometheus告警规则 您可以通过设定Prometheus告警规则为特定的监控指标设定触发告警条件。当监控指标满足这些条件时,系统将会生成相应的告警事件,并通过短信、电子邮件、Webhook等多种渠道发送告警通知。 前提条件 已接入Prometheus监控,具体操作,请参见快速入门。 功能入口 1. 登录应用性能监控APM控制台,点击左侧菜单栏Prometheus监控。 2. 在Prometheus监控菜单下,单击告警规则页面。 3. 在告警规则页面,点击创建告警规则按钮。具体操作方式请见下方。 创建告警规则 通过静态阈值创建告警规则 静态阈值检查类型提供了一系列系统预设的告警指标。您可以直接选择这些现有指标,快速建立相应指标的告警规则。可参考以下参数说明进行配置。 字段 说明 示例 告警名称 自定义告警的名称。 容器CPU使用率告警 检测类型 选择静态阈值。 静态阈值 Prometheus实例 选择需要创建告警的Prometheus实例。 生产集群 告警分组 选择告警分组,不同的告警分组包含不同的告警指标。 Kubernetes负载 告警指标 选择需要进行监控告警的指标,每个告警分组包含不同的指标。 Pod磁盘使用率 告警条件 基于告警指标预置内容,设置告警事件产生条件,如比较符与阈值。 当Pod磁盘使用率>80时,满足告警条件。 数据预览 根据告警指标,设置当前配置的告警规则适用的范围,即所有符合筛选条件的资源满足此条告警规则时,均会产生告警事件。 持续时间 当告警条件满足时,直接产生告警事件:任何一个数据点满足阈值,就会产生告警事件。 当告警条件满足持续N分钟时,才产生告警事件:即只有当满足阈值的时间大于等于N分钟时,才产生告警事件。 告警等级 自定义告警等级。告警严重程度从一般,次要,重要,紧急逐级上升。 一般 告警内容 用户收到的告警信息。您可以使用Go template语法在告警内容中自定义告警参数变量。 命名空间:{{namespace}} / Pod: {{podname}} / 容器:{{container}} CPU使用率{{metricsparamsoptlabelvalue}} {{$metricsparamsvalue}}%, 当前值{{ printf "%.2f" $value }}% 通知策略 不指定通知规则:若勾选该选项,在告警规则创建完成后,您可在通知策略界面新建策略,并通过设置匹配规则与匹配条件(例如告警规则名称)关联对应告警规则。当此告警规则触发并生成告警事件时,系统会将告警信息推送至通知策略中指定的联系人或联系人组。更多相关说明,可参考通知策略文档。 指定某个通知策略:若选择此项,系统会自动在对应的通知策略中添加一条匹配规则,匹配规则内容为告警规则ID(以告警规则名称的方式呈现),以确保当前告警规则产生的告警事件一定可以被选择的通知策略匹配到。 不指定通知规则 高级设置 标签 设置告警标签,设置的标签可用作规则静默的选项。 无 参考以上参数配置说明,设置完成后,点击保存。在Prometheus告警规则列表页面,可查看当前告警规则的状态。