操作场景
ZOS支持数据监控功能,您可以通过云监控获得用户维度和桶维度的各种指标信息,支持查看各个存储类型(标准、低频、归档)和冗余类型(单AZ、多AZ)下的细颗粒度统计数据。
约束与限制
- 云监控服务不需要开通,会在用户创建资源ZOS后自动启动。
- 云监控支持的资源池请参见产品能力地图。
存储桶维度的监控
操作步骤
- 点击天翼云门户首页的“控制中心”,输入登录的用户名和密码,进入控制中心页面。
- 在控制台上方点击
,选择地域,以下操作选择杭州7。 - 在控制台首页,选择“存储>对象存储”。
- 在对象存储桶列表选择需要查看监控的bucket,并点击该bucket右侧的"监控"。
- 在监控数据界面中,可查看该存储桶的各项监控指标,分别为总存储容量、总对象数量、本月公网流出流量、本月请求次数、公网流出流量、公网流入流量、内网流出流量、内网流入流量、平均使用带宽、公网请求次数、内网请求次数、有效请求率、数据取回流量、操作分类平均延时、操作分类最大延时、成功请求操作分类。
注意对于公共资源池中的地域,如华东-华东1,您可以在天翼云官网首页点击产品-迁移及管理-管理工具-云监控-管理控制台,直接在云监控产品中,选择对象存储监控,通过切换地域的方式,来查看地域内各项监控指标。
桶维度监控指标说明
监控指标 说明 测量维度 取值范围 监控周期 总存储容量 存储桶中的总存储量。 桶 ≥0 bytes 1小时 总对象数量 存储桶中存储的总对象数量。 桶 ≥0 个 1小时 状态码个数 存储桶产生请求状态码的数量。可区分 2xx、3xx、4xx、5xx 状态码。 桶 ≥0 个 1分钟 延时 存储桶产生请求时延。可区分 GET 类(读请求) 请求时延、PUT 类(写请求)请求时延以及总请求时延。 桶 ≥0 ms 1分钟 本月公网流出流量 本月存储桶向公网传输数据的流量之和。 桶 ≥0 bytes 1小时 本月请求次数 本月对存储桶的操作请求次数之和。可区分读请求、写请求。 桶 ≥0 次 1小时 公网流出流量 存储桶向公网传输数据的流量。 桶 ≥0 bytes 1小时 公网流入流量 存储桶从公网接收数据的流量。 桶 ≥0 bytes 1小时 内网流出流量 存储桶向内网传输数据的流量。 桶 ≥0 bytes 1小时 内网流入流量 存储桶从内网接收数据的流量。 桶 ≥0 bytes 1小时 平均使用带宽
存储桶所使用的平均带宽量。
其下包含的指标的每个数据点是一小时内的流量之和除以3600秒计算得出的。
可区分公网流入带宽、内网流入带宽、公网流出带宽以及内网流出带宽。
桶 ≥0 bytes 1小时 公网请求数 存储桶产生的公网请求的总次数。 桶 ≥0 次 1小时 内网请求数 存储桶产生的内网请求的总次数。 桶 ≥0 次 1小时 有效请求率 有效请求数占总请求数的百分比。有效有效请求数指返回状态码为2xx和3xx的请求总数。可区分读请求、写请求。 桶 ≥0 % 1小时 数据取回流量 存储桶发生数据取回操作取回数据的流量。可区分低频存储数据取回流量和归档存储数据取回流量。 桶 ≥0 bytes 1小时 操作分类平均延时 监控服务提供了分钟级别的平均延时,且只对返回状态码为2xx的成功请求进行监控,反映系统平均响应能力。包括:
GetObject请求平均E2E延时
HeadObject请求平均E2E延时
PutObject请求平均E2E延时
PutObject请求平均服务器延时
PostObject请求平均E2E延时
PostObject请求平均服务器延时
AppendObject请求平均E2E延时
AppendObject请求平均服务器延时
UploadPart请求平均E2E延时
UploadPart请求平均服务器延时
UploadPartCopy请求平均E2E延时
UploadPartCopy请求平均服务器延时
桶
≥0 ms 1分钟 操作分类最大延时 监控服务提供了分钟级别的最大延时,且只对返回状态码为2xx的成功请求进行监控,反映系统抖动情况。包括:
GetObject请求最大E2E延时
HeadObject请求最大E2E延时
PutObject请求最大E2E延时
PutObject请求最大服务器延时
PostObject请求最大E2E延时
PostObject请求最大服务器延时
AppendObject请求最大E2E延时
AppendObject请求最大服务器延时
UploadPart请求最大E2E延时
UploadPart请求最大服务器延时
UploadPartCopy请求最大E2E延时
UploadPartCopy请求最大服务器延时
桶 ≥0 ms 1分钟 成功请求操作分类 成功请求的监控一定程度上反映了系统处理访问请求的能力。具体指标项包括:
GetObject成功请求数
HeadObject成功请求数
PutObject成功请求数
PostObject成功请求数
AppendObject成功请求数
UploadPart成功请求数
UploadPartCopy成功请求数
DeleteObject成功请求数
DeleteObjects成功请求数
桶 ≥0 次 1分钟
说明延时监控指标分别从E2E和服务器两条不同的链路进行收集,便于分析性能热点以及环境问题,其中:
E2E延时是指向对象存储系统发出的成功请求的端到端滞后时间,包括在对象存储系统中读取请求、发送响应以及接收响应确认所需的处理时间。
服务器延时是指对象存储系统成功处理请求所使用的滞后时间,不包括E2E延时中的网络滞后时间。
用户维度的监控
在用户维度上,您可以查看的监控指标为:用户级存储容量、用户级对象总数、本月公网流出流量、本月请求次数、用户级公网流出流量、用户级公网流入流量、用户级内网流出流量、用户级内网流入流量、用户级平均使用带宽、用户级公网请求次数、用户级内网请求次数、用户级有效请求率、数据取回流量、服务监控总览、请求状态详情。
用户维度监控指标
监控指标 说明 测量维度 取值范围 监控周期 用户级存储容量 用户的所有存储桶的总存储量之和。 用户 ≥0 bytes 1小时 用户级对象总数 用户的所有存储桶中存储的总对象数量之和。 用户 ≥0 个 1小时 状态码个数 用户的所有存储桶产生请求状态码的数量。可区分 2xx、3xx、4xx、5xx 状态码。 用户 ≥0 个 1分钟 本月公网流出流量 用户的所有存储桶在本月向公网传输数据的流量之和。 用户 ≥0 bytes 1小时 本月请求次数 用户的所有存储桶在本月的操作请求次数之和。 用户 ≥0 次 1小时 用户级公网流出流量 用户的所有存储桶向公网传输数据的流量之和。 用户 ≥0 bytes 1小时 用户级公网流入流量 用户的所有存储桶从公网接收数据的流量之和。 用户 ≥0 bytes 1小时 用户级内网流出流量 用户的所有存储桶向内网传输数据的流量之和。 用户 ≥0 bytes 1小时 用户级内网流入流量 用户的所有存储桶从内网接收数据的流量之和。 用户 ≥0 bytes 1小时 用户级平均使用带宽 用户的所有存储桶所使用的平均带宽量。 其下包含的指标的每个数据点是一小时内的流量之和除以3600秒计算得出的。
用户 ≥0 bytes 1小时 用户级公网请求数 用户的所有存储桶产生的公网请求的总次数之和。 用户 ≥0 次 1小时 用户级内网请求数 用户的所有存储桶产生的内网请求的总次数之和。 用户 ≥0 次 1小时 用户级有效请求率用 户的所有有效请求数占总请求数的百分比。有效有效请求数指返回状态码为2xx和3xx的请求总数。 用户 ≥0 % 1小时 数据取回流量 用户的所有存储桶发生数据取回操作取回数据的流量。可区分低频存储数据取回流量和归档存储数据取回流量。 用户 ≥0 bytes 1小时 服务监控总览 对象存储服务使用总体请求情况。包括1分钟内的总请求数、总有效请求数(返回状态码为2xx和3xx的请求总数)。 用户 ≥0 次 1分钟 对象存储服务使用总体请求情况。包括1分钟内的总有效请求率(有效请求占总请求数的百分比)和可用性(存储服务的系统可用性衡量指标)。可用性计算方式:(1-5XX请求总数/总请求数)*100%
用户 ≥0 % 1分钟 请求状态详情 根据请求返回状态码或者对象存储错误码进行分类的请求的监控信息。体现具体请求数的监控指标包括:
服务端请求错误请求数(返回状态码为5xx的系统级错误请求总数)
客户端授权错误请求数(返回状态码403的请求总数)
客户端资源不存在错误请求数(返回状态码为404的请求总数)
客户端其他错误请求总数(除了以上提到的客户端错误请求之外的其他返回状态码为4xx的请求总数)
成功请求数(返回状态码为2xx的请求总数)
重定向请求数(返回状态码为3xx的请求总数)
用户 ≥0 次 1分钟 根据请求返回状态码或者对象存储错误码进行分类的请求的监控信息。体现请求数占比的监控指标包括:
服务端请求错误请求占比(服务端错误请求总数占总请求数的百分比)
客户端授权错误请求占比(授权错误请求数占总请求数的百分比)
客户端资源不存在错误请求占比(资源不存在错误请求数占总请求数百分比)
客户端其他错误请求占比(客户端其他错误请求数占总请求数的百分比)
成功请求占比(成功请求数占总请求数的百分比)
重定向请求占比(重定向请求数占总请求数的百分比)
用户 ≥0 % 1分钟
创建告警规则
除了查看监控指标外,您还可以在云监控控制台创建告警规则对指标进行监控。当资源的监控指标达到告警条件,云监控将向您发送告警消息,报告异常监控数据,帮助您及时掌握异常状态并处理,保证业务顺畅进行。
云监控提供了自定义创建告警模板的功能,您可以选择在默认模板推荐的监控指标上进行修改,或自定义添加告警指标完成自定义告警模板的添加。
操作步骤
- 在云监控控制台左侧导航栏,点击“告警规则”,再点击右上角“创建告警规则”。
- 选择监控对象和监控指标,填写规则信息,点击“确定”即可创建告警规则。
配置参数如下:
步骤类别 参数 参数说明 选择监控对象 规则类型 选择指标监控:对数据指标进行监控 云服务 选择对象存储 维度 用户、存储桶维度二选一 监控对象 用户维度监控对象为当前天翼云账号,桶维度可按需选择需要监控的桶作为监控对象 选择监控指标 选择类型 可以选择从模板导入或自定义创建 模板 选择需要导入的模板 监控指标 选择需要监控的数据指标 策略 可以选择原始值、平均值、最大值、最小值 聚合周期 选择数据聚合的周期 出现次数 选择出现多少次触发通知 发送通知 配置是否发送邮件通知用户,可以选择“是”或者“否”,推荐选择“是” 选择告警联系组 配置发生告警通知的用户组 重复告警 告警发生后,如果监控项未恢复正常,之后间隔多久再次发送告警 触发场景 触发告警邮件的场景,可在告警及恢复时发送提醒信息 通知周期 配置告警通知的周期时间 通知时段 配置告警通知的时间段 通知方式 配置告警通知的通知方式,支持邮箱及短信 规则信息 名称 填写该告警规则的名称 企业项目 选择告警规则适用的企业项目 描述项 添加对该告警规则的描述