功能入口
- 选择目标资源池,并登录APM组件控制台。
- 在左侧导航栏中选择「 应用列表 」。
- 在应用列表中选择您想查看的应用,点击「 应用名称 」打开新的应用详情链接。
- 在左侧导航栏中选择「 应用总览 」,您可以在应用总览页面顶部选择 「 概览 」 或 「 拓扑图 」页签查看相应信息。
功能说明
概览
总览指标
- 总请求量 :筛选时间段内,应用提供服务请求量+应用依赖服务请求量。
- 平均响应时间 :筛选时间段内,(所有应用提供服务响应时间+所有应用依赖服务响应时间)/总请求量。
- 错误数 :error,筛选时间段内,请求出错的数量,通常指http状态码为4xx、5xx的请求。
- FullGC :筛选时间段内,整堆垃圾回收的次数,回收的区域包括年轻代、老年代以及方法区。
- 慢SQL :筛选时间段内,执行时间大于等于慢SQL阈值的SQL数量,默认500ms,您可根据实际情况在「应用设置」中修改。
- 异常 :exception,筛选时间段内,该应用报的异常数。
- 慢调用 :筛选时间段内,响应时间大于等于慢调用阈值的调用数量,默认500ms,您可根据实际情况在「应用设置」中修改响应时间阈值。
应用提供服务
因用户访问该应用而产生的数据 ,例如用户在浏览器中访问该应用。
- 应用提供服务请求量 :筛选时间段内,用户向该应用发起的请求数量。
- 应用提供服务平均响应时间 :响应时间是指从用户发起请求到服务端给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。
应用依赖服务
因该应用访问其他服务而产生的数据 ,例如该应用访问数据库。
- 应用依赖服务请求量 :筛选时间段内,该应用向其他服务发起的请求数量。
- 应用依赖服务平均响应时间 :响应时间是指从该应用发起请求到其他服务给予反馈的时长,平均响应时间是筛选时间段内,所有请求的响应时间的平均值。
- 应用实例数 :筛选时间段内,有调用行为的应用实例数量。
- HTTP-状态码统计 。
- 5xx:服务器异常,服务器在处理请求的过程中发生错误。
- 4xx:客户端异常,请求包含语法错误或无法完成请求。
- 3xx:重定向问题,需要进一步操作。
- 2xx:成功,服务器成功接收请求并执行。
- 200:请求成功。
慢调用
该应用访问其他服务时,其他服务响应时间大于等于500ms(默认500ms,可在应用设置中修改阈值)的调用,定义为慢调用。显示饼图和详情表,表头显示如下。
- 时间 :判定为慢调用的时间点。
- 服务名 :被调用的服务名称。
- IP :被调用的服务的IP地址。
- 耗时(ms) :具体响应时间。
- 响应码 :200表示请求成功,03表示调用时长超过最大监听时长15秒。
- TraceID :Trace表示一个完整的请求链路,一个Trace包含了多个调用过程span,TraceID是该请求链路的唯一标识。
统计分析
以接口维度来统计调用的情况。
- 接口名称 :被调用的接口的名称。
- 最大值 :筛选时间段内,该接口被调用的响应时间的最大值。
- 平均值 :筛选时间段内,该接口被调用的平均响应时间。
- 平均响应时间 :筛选时间段内,每天的平均响应时间的趋势图。
- 异常类型 :显示异常明细,与点击详情按钮看到的内容一致。
- 出现次数 :筛选时间段内,此类异常出现的次数。
拓扑分析
拓扑图
拓扑图是一种以图形化方式展示应用之间关系的图表,帮助开发人员或运维人员了解应用程序的整体结构和运行状况。
拓扑图通常包括以下信息:
- 应用或服务的组成部分 :例如数据库、缓存、消息队列、Web 服务器等。
- 组件之间的依赖关系 :例如一个组件调用另一个组件的接口等。
- 基础指标 :例如请求量、时延等,帮助开发/运维人员了解组件的运行状况和性能状况。
通过分析拓扑图,开发/运维人员可以快速定位应用中的问题,并进行及时的排查和修复。拓扑图还可以帮助开发/运维人员进行容量规划和性能优化,以提高应用程序或服务的性能和可靠性。
实例健康
通过“实例平均响应时间”判断该应用所有实例的健康程度。
健康程度
- 正常:小于500ms。
- 警告:大于等于500ms,小于1s。
- 严重:大于等于1s。
实例的调用详情
- 调用类型 :根据该应用调用和被调用对象的不同来区分类型,包括http入口、调用redis、调用http、调用mysql、未知调用等等。
- 调用次数 :筛选时间段内,调用的次数。
- 平均响应时间 :筛选时间段内,调用等待响应的平均时长。
- 错误率 :筛选时间段内,调用错误次数/调用次数。
请求数、响应时间、错误数
将应用的调用详情按天展示,包括请求数、响应时间、错误数。