告警规则指标说明 本文介绍APM应用监控告警规则中各类型的指标说明,所有告警指标的最小时间颗粒度为1分钟。 异常接口调用 指标说明 指标名称 单位 是否为常用指标 指标说明 应用异常调用次数 无 是 在软件系统运行过程中发生的应用异常调用次数。 应用异常调用响应时间 毫秒 是 该应用异常调用的响应时间,其中,异常调用指调用中出现异常抛错的调用。可以根据该指标判断调用堆栈抛错对应用调用响应时间的影响大小,从而判断是否存在应用调用异常。 应用异常接口调用次数 无 是 在软件系统运行过程中发生的应用异常接口调用次数。 应用异常接口调用响应时间 毫秒 是 该应用异常调用的响应时间,其中,异常调用指调用中出现异常抛错的调用。可以根据该指标判断调用堆栈抛错对应用调用响应时间的影响大小,从而判断是否存在应用调用异常。 指标维度 接口名称,筛选条件如下: 任意:遍历每个访问到的接口,针对每个接口的指标数据单独进行监控告警。 等于 :指定筛选固定的几个接口进行监控告警,示例:/ctyun/api/users/{userId}。 应用调用类型统计 指标说明 指标名称 单位 是否为常用指标 指标说明 应用依赖服务调用次数 无 不是 该应用依赖的下游接口的调用次数,用于判断下游依赖服务调用是否增多。 应用依赖服务调用错误次数 无 不是 该应用依赖的下游接口的错误次数除以总请求数,用于判断下游依赖服务报错是否增多,影响当前应用。 应用依赖服务调用错误率(%) 无 不是 该应用依赖的下游接口的错误次数除以总请求数,用于判断下游依赖服务报错是否增多,影响当前应用。 应用依赖服务调用响应时间 毫秒 是 该应用依赖的下游接口的平均响应时间,用于判断下游依赖服务耗时是否增多,影响当前应用。 应用提供服务调用次数 无 是 应用入口调用(包括调用HTTP入口、调用Dubbo入口等)的次数。可以根据该指标分析当前应用调用量的大小,从而判断业务量的大小,以及通过调用量是否偏大或偏小判断应用是否存在异常。 应用提供服务调用错误次数 无 是 应用入口调用(包括调用HTTP入口和调用Dubbo入口等)的错误次数,调用错误是指整个对外(HTTP、Dubbo)调用行为的返回状态码>400的情况, 或者Dubbo有异常被最上层拦截的情况,都视为错误。可以根据该指标判断应用是否存在调用错误。 应用提供服务调用错误率(%) 无 是 应用入口调用的调用错误次数的总和/入口的调用次数的总和100%。 应用提供服务调用响应时间 毫秒 是 应用入口调用(包括调用HTTP入口、调用Dubbo入口等)的响应时间。可以根据该指标判断是否有慢请求出现,从而判断应用是否存在异常。