操作场景
云监控支持灵活的创建告警规则。您既可以根据实际需要对某个特定的监控指标设置自定义告警规则,同时也能够使用告警模板为多个资源或者云服务批量创建告警规则。
在您使用告警模板创建告警规则之前,云监控已经根据各个云服务的应用属性,为各个云服务量身定做了默认使用的告警模板,供您选择使用。同时云监控为用户提供了自定义创建告警模板的功能,您可以选择在默认模板推荐的监控指标上进行修改,或自定义添加告警指标完成自定义告警模板的添加。
前提条件
注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。
操作步骤
- 登录控制中心。
- 在控制中心页面左上角点击
,选择区域,本文我们选择华东1。
- 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。
- 单击“告警服务”下拉菜单,单击“告警规则”,进入告警规则列表页面。
- 在“告警规则”列表界面,单击“创建告警规则”按钮。
- 在“创建告警规则”页面,根据界面提示配置参数。
- 配置参数如下:
模块 参数 参数说明 配置示例 备注
选择监控对象
规则类型 选择规则的类型,主要包括指标监控、事件监控、站点监控、自定义监控、自定义事件五种。 指标监控 自定义监控、自定义事件目前仅支持部分资源池 服务 配置告警规则监控的云服务资源类型。 云主机 维度 用于指定告警规则对应指标的维度名称。 云主机 监控对象类型 具体实例/资源分组 具体实例 监控对象 用来配置该告警规则针对的具体资源,可以是一个或多个。
定义告警策略
选择类型 自定义创建/从模板导入。 自定义创建 策略 满足全部/任一策略,检查频率为设定值,其中策略信息包括:指标、数据类型(原始值、最大值、最小值、平均值)、判断条件(>、≥、<、≤、=、环比上升、环比下降、环比变化)、值、单位、发生次数。
满是全部以下条件:若CPU使用率原始值>=0%,连续1个检测周期,检测频率为60s同一告警规则下,告警条件最多支持添加20条
配置告警通知
发送通知 配置是否发送邮件通知用户,可以选择“是” (推荐选择)或者“否”。 是 告警联系组 配置发生告警通知的用户组。 触发场景 触发告警邮件的场景,可在告警及恢复时发送提醒信息。 出现告警 通知方式 配置告警通知的通知方式,支持邮箱及短信。 邮箱 重复告警 指告警发生后如果未恢复正常,将重复发送告警通知次数。 不重复 通知周期 配置告警通知的周期时间。 星期天、星期一、星期二、星期三、星期四、星期五、星期六 通知时段 配置告警通知的时间段。 00:00:00-23:59:59 告警回调 配置告警通知webhook地址。
规则信息
名称 该告警规则的自定义名称。 企业项目 选择告警规则适用的企业项目。 描述 添加对该告警规则描述(此参数非必填项)。
说明
告警规则添加完成后,当监控指标触发设定的阈值时,云监控会在第一时间通过邮件实时告知您云上资源异常,以免因此造成业务损失。
关于如何使用回调接口,请参见使用告警回调。
说明针对监控无数据状态,可配置三种处理策略。
不做处理
逻辑说明:当监控指标在指定周期内没有产生数据时,云监控不会触发任何告警动作,也不会对该情况进行特殊标记或通知。相当于忽略无数据的情况,继续按照正常的告警逻辑,等待后续有数据时再进行判断 。
适用场景:适用于监控指标偶尔会因为业务特性、网络波动等原因出现短暂无数据,但这种无数据情况不会对业务运行产生实质性影响,且频繁发送无数据告警会干扰运维人员的场景。
视为告警
逻辑说明:一旦监控指标在设定的时间周期内没有接收到新的数据,如用户配置告警通知渠道,云监控就会按照预先配置的方式(如短信、邮件等)发送告警信息,提示相关人员当前指标出现无数据的情况。
适用场景:适用于对数据连续性要求较高的业务场景,即无数据本身就可能意味着业务出现异常或者数据采集链路出现故障的情况。
视为恢复
逻辑说明:当监控指标之前处于触发告警的状态,而在后续某个周期内出现无数据的情况时,云监控会将这种无数据状态视为告警已经恢复,自动将告警状态更新为恢复,并按照配置的通知方式发送告警恢复的通知。但如果指标从未触发过告警,单纯出现无数据,不会发送恢复通知 。
适用场景:适用于那些依赖数据来判断告警状态,且无数据可以被认为是问题已解决的场景。
注意
告警规则创建>定义告警策略模块,“检测频率”如需支持修改,请联系客户经理开放功能。
检测频率,即每次告警数据检测任务间隔的时间,默认为1分钟。如云资源监控数据频率为1min,调整告警规则检测频率为30s,则连续两个检测周期,查询获取的数据可能为同一数据点。