云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      天翼云云监控ces_相关内容
      • 监控
        本页面介绍云数据库ClickHouse通过控制台提供的查看实例监控信息功能。 我们提供全面的监控功能,用于实时监测和评估您的云数据库ClickHouse集群的性能和运行状况: 1. 登录云数据库ClickHouse控制台,并选择实例所在区域。 2. 在实例列表页面,点击目标实例ID所在行的"管理"按钮进入详细信息页面。 3. 在实例详细信息页面上方导航栏中,选择"监控管理"选项。 以下是我们支持的监控指标的详细描述: 监控指标 描述 CPU使用率 监测每个ClickHouse节点的CPU利用率,反映节点的计算能力和负载情况。您可以通过监控CPU使用率来评估系统的处理能力,并及时进行资源调整。 内存使用量 跟踪每个ClickHouse节点的内存消耗情况,了解内存使用情况可以帮助您优化查询性能和调整内存配置。 磁盘使用空间 监控每个ClickHouse节点的磁盘空间占用情况,确保有足够的存储空间来容纳数据和执行操作。及时了解磁盘使用情况可以避免因存储空间不足而导致的数据丢失或运行故障。 每秒IO次数 记录每秒的输入输出操作次数,包括读取和写入数据的次数。通过监控每秒IO次数,您可以评估ClickHouse节点的IO性能和磁盘负载情况,以便进行性能优化和容量规划。 每秒读写字节数 监测每秒读取和写入的数据量,帮助您了解数据处理速度和吞吐量。通过监控每秒读写字节数,您可以评估系统的数据处理能力,并根据需要进行调整和优化。 当前运行查询数 实时跟踪正在运行的查询数量,反映系统的查询负载和性能状况。通过监控当前运行查询数,您可以了解系统的负载情况,并做出相应的优化和调整。 合并数量 监控数据合并操作的数量,用于评估数据压缩和合并操作的效率。通过监控合并数量,您可以了解数据压缩和合并的效果,并根据需要进行优化。 分区变更数量 记录分区变更的次数,用于跟踪分区操作和数据变更情况。了解分区变更数量可以帮助您追踪数据变更的频率和趋势,以及相应的系统影响。 后台任务数 跟踪后台任务的数量,包括数据清理、数据复制等后台处理任务。通过监控后台任务数,您可以了解后台处理的工作负载和执行情况,以及相应的资源占用。 TCP连接数 监控每个ClickHouse节点的TCP连接数量,用于评估网络连接的负载和性能状况。了解TCP连接数可以帮助您优化网络配置和资源分配。 HTTP连接数 记录每个ClickHouse节点的HTTP连接数量,帮助您追踪HTTP请求的并发情况。通过监控HTTP连接数,您可以评估系统的网络负载和处理能力。 Zookeeper监听数 监测Zookeeper集群中的监听数,用于了解集群状态和数据同步情况。通过监控Zookeeper监听数,您可以评估集群的稳定性和可用性。 Zookeeper会话数 跟踪Zookeeper集群中的会话数,用于评估集群的稳定性和连接状态。了解Zookeeper会话数可以帮助您监控集群的健康状况和系统连接情况。 通过这些详细的监控指标,您可以全面了解和掌握云数据库ClickHouse集群的性能表现、资源利用和系统状态,以便及时调整和优化系统配置,确保系统的高可用性、高性能和稳定性。
        来自:
        帮助文档
        云数据库ClickHouse
        用户指南
        监控
      • RabbitMqProducer监控
        本文主要介绍RabbitMqProducer监控 介绍APM采集的RabbitMqProducer监控指标的类别、名称、含义等信息。 表RabbitMqProducer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: 异常(exception,RabbitMqProducer调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常(exception,RabbitMqProducer调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常(exception,RabbitMqProducer调用的异常信息统计。) stackTrace 异常堆栈 该异常产生的堆栈信息 CLOB LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) connection connection producer连接信息 ENUM LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) exchange exchange exchange名 ENUM LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) concurrentMax 最大并发 推送消息最大并发 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) errorCount 错误次数 推送消息的错误次数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) invokeCount invokeCount Publish调用次数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) publishedMsgCount publishedMsgCount 推送消息数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) publishedBytes 推送字节数 推送字节数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX exchange监控(exchangePublish,以exchange为维度统计消息推送详情) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST exchange监控(exchangePublish,以exchange为维度统计消息推送详情) totalTime 总响应时间 推送消息的总响应时间 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range1 010ms 响应时间在010ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range2 10100ms 响应时间在10100ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range3 100200ms 响应时间在100200ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range5 110s 响应时间在110s范围请求数 INT SUM exchange监控(exchangePublish,以exchange为维度统计消息推送详情) range6 10s以上 响应时间在10s以上请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) connection connection producer连接信息 ENUM LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionCount 当前连接数 当前连接数 INT LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelCount 当前Channel数 当前Channel数 INT LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionCreated 创建连接数 创建连接数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) connectionClosed 销毁连接数 销毁连接数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelCreated 创建Channel数 创建Channel数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) channelClosed 销毁Channel数 销毁Channel数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) concurrentMax 最大并发 推送消息最大并发 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) errorCount 错误次数 推送消息的错误次数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) invokeCount invokeCount Publish调用次数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) publishedMsgCount publishedMsgCount 推送消息数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) publishedBytes 推送字节数 推送字节数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX connection监控(connectionPublish,以connection为维度统计消息推送详情。) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST connection监控(connectionPublish,以connection为维度统计消息推送详情。) totalTime 总响应时间 推送消息的总响应时间 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range5 110s 响应时间在110s范围请求数 INT SUM connection监控(connectionPublish,以connection为维度统计消息推送详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) concurrentMax 最大并发 推送消息最大并发 INT MAX total监控(total,以客户端为维度统计消息推送详情。) errorCount 错误次数 推送消息的错误次数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息推送详情。) invokeCount invokeCount Publish调用次数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) publishedMsgCount publishedMsgCount 推送消息数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) publishedBytes 推送字节数 推送字节数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) maxSingleMsgBytes 单次推送最大字节数 单次推送最大字节数 INT MAX total监控(total,以客户端为维度统计消息推送详情。) lastError 错误信息 推送消息发生错误产生的错误信息 STRING LAST total监控(total,以客户端为维度统计消息推送详情。) maxTime 最大响应时间 推送消息的最大响应时间 INT MAX total监控(total,以客户端为维度统计消息推送详情。) runningCount 正在执行数 采集时间点正在执行的推送消息数量 INT SUM total监控(total,以客户端为维度统计消息推送详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息推送详情。) totalTime 总响应时间 推送消息的总响应时间 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range5 110s 响应时间在110s范围请求数 INT SUM total监控(total,以客户端为维度统计消息推送详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        消息队列
        RabbitMqProducer监控
      • 获取实时监控数据
        名称 类型 描述 dimension String 监控对象: system:系统。 pool:存储池(仅集群版支持)。 server:服务器。 disk:数据目录所在磁盘分区。 LUN:卷。 instanceId String 监控对象实例: 监控对象为system,显示HBlock名称。 监控对象为pool,显示存储池名称(仅集群版支持)。 监控对象为server,显示为服务器ID。 监控对象为disk,显示为数据目录。 监控对象为LUN,显示为卷名称。 metric String 指标名称。具体详见 avgValueSeries Array of string 监控数据的[时间,数值]序列。 时间为unix时间戳,精确到毫秒。
        来自:
        帮助文档
        存储资源盘活系统
        API参考
        监控
        获取实时监控数据
      • 主机审计
        文件访问监控 监控目标文件、目录的改写操作。适用于需要自定义修改配置策略模板文件访问监控场景。 1. 选择文件访问监控页签。 2. 点击文件访问监控后的图标置于开启状态,开启文件访问控制。 3. 点击“新增”。 4. 弹出新增文件访问监控 对话框,输入文件路径、备注,点击“确定”即可添加文件访问监控。
        来自:
        帮助文档
        智算安全专区
        用户指南
        大模型安全卫士
        策略管理
        主机策略
        主机策略配置说明
        主机审计
      • GRPCServer监控
        本文主要介绍GRPCServer监控 介绍APM采集的GRPCServer监控指标的类别、名称、含义等信息。 表 GRPCServer监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 采样类型 radio JAVA 4 1.0.0 采样类型,支持四种采样,全采、百分比采集、每分钟固定数量采样、默认智能采样。 百分比采集数值 integer JAVA 10 1.0.0 调用链数据按百分比采样值。 每分钟采集数值 integer JAVA 1000 1.0.0 调用链数据每分钟采集数值。 慢请求阈值定义 integer JAVA 800 2.0.0 定义慢请求阈值,超过该阈值的方法会定义为慢方法,默认提高调用链采样率。 方法配置 objarray JAVA 2.0.0 单独配置每个方法的慢请求阈值和采样率;采样方式包含2.百分比采样;3.每分钟固定数量采样;4.自动采样三种采样方式。 表 GRPCServer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: 方法监控(detail,以方法维度统计接口调用数据。) method method 请求的方法 ENUM LAST 方法监控(detail,以方法维度统计接口调用数据。) concurrentMax 最大并发 该方法的最大并发 INT MAX 方法监控(detail,以方法维度统计接口调用数据。) errorCount 错误数 该方法的错误数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) invokeCount 调用次数 该方法的调用次数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) maxTime 最大响应时间 该方法在采集周期内最大响应时间 INT MAX 方法监控(detail,以方法维度统计接口调用数据。) runningCount 正在执行数 该方法在采集时间点正在执行数量 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range1 010ms 响应时间在010ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range5 110s 响应时间在110s范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range6 10s以上 响应时间在10s以上请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) totalTime 总响应时间 该方法的总响应时间 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) clusterId 集群id 调用方的集群id ENUM LAST 集群调用(cluster,以调用方集群id维度统计接口调用数据。) invokeCount 调用次数 该集群的调用次数 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) totalTime 总响应时间 该集群调用的总响应时间 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) errorCount 错误次数 该集群调用的错误次数 INT SUM
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        远程过程调用
        GRPCServer监控
      • 查看和定制集群监控指标
        方式三(适用于MRS 3.x及之后版本集群) 1.登录MRS控制台。 2.选择“集群列表 > 现有集群”,单击集群名称进入集群详情页面。 3.在“概览”页签的基本信息区域,单击“IAM用户同步”右侧的“单击同步”进行IAM用户同步。 4.用户同步完成后即可在页面右侧查看到集群的监控指标报表。 5.在时间区间选择需要查看监控数据的时间段。可供选择的选项如下: 近1小时 近3小时 近12小时 近24小时 近7天 近1个月 自定义:在时间范围内自行选择需要查看的时间。 6.自定义监控指标报表。 a.单击“定制”,勾选需要显示的监控指标。 界面最多显示12个定制的监控指标。 b.单击“确定”保存并显示所选指标。 说明 单击“清除”可批量取消全部选中的指标项。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        管理集群
        集群概览
        查看和定制集群监控指标
      • 支持的监控指标
        主题监控指标 表主题支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) topicbytesinrate 生产流量 该指标用于统计每秒生产的字节数。单位:Byte/s、KB/s、MB/s、GB/s 说明 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000000 Kafka实例队列 1分钟 topicbytesoutrate 消费流量 该指标用于统计每秒消费的字节数。单位:Byte/s、KB/s、MB/s、GB/s 说明 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000000 Kafka实例队列 1分钟 topicdatasize 队列数据容量 该指标用于统计队列当前的消息数据大小。单位:Byte、KB、MB、GB、TB、PB 说明 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~5000000000000 Kafka实例队列 1分钟 topicmessages 队列消息总数 该指标用于统计队列当前的消息总数。单位:Count 说明 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 ≥ 0 Kafka实例队列 1分钟 topicmessagesinrate 消息生产速率 该指标用于统计每秒生产的消息数量。单位:Count/s 说明 在“主题”页签,当“监控类型”为“基本监控”时,才包含该指标。 0~500000 Kafka实例队列 1分钟 partitionmessages 分区消息数 该指标用于统计分区中当前的消息个数。单位:Count 说明 在“主题”页签,当“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Kafka实例队列 1分钟 producedmessages 生产消息数 该指标用于统计目前生产的消息总数。单位:Count 说明 在“主题”页签,当“监控类型”为“分区监控”时,才包含该指标。 ≥ 0 Kafka实例队列 1分钟
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        监控
        支持的监控指标
      • 监控
        了解存储资源盘活系统的监控功能。 点击左侧导航栏中的“运维”>“监控”,进入“监控”页面,查看系统(集群版)、存储池(集群版)、服务器、数据目录、卷的性能表现。 系统(集群版适用) 在“监控”页面点击“系统” ,可以查看以下指标指定时间段的监控曲线:数据目录使用率、容量配额使用率、数据目录使用量、数据目录总容量、配额使用量、配额、读带宽、写带宽、总带宽、读IOPS、写IOPS、总IOPS、读时延、写时延、总时延、上云上传带宽、上云下载带宽、上云总带宽。 存储池(集群版适用) 在“监控”页面,点击“存储池”,可以查看存储池内HBlock指定时间内的监控信息:数据目录使用率、容量配额使用率、数据目录使用量、数据目录总容量、配额使用量、配额、读带宽、写带宽、总带宽、读IOPS、写IOPS、总IOPS、读时延、写时延、总时延。 服务器(集群版适用) 在“监控”页面点击“服务器”,可以查看对应服务器上HBlock实时监控信息:CPU使用率、内存使用量、内存总量、数据目录使用率、容量配额使用率、数据目录使用量、数据目录总容量、配额使用量、配额、读带宽、写带宽、总带宽、读IOPS、写IOPS、总IOPS、读时延、写时延、总时延、上云上传带宽、上云下载带宽、上云总带宽。
        来自:
        帮助文档
        存储资源盘活系统
        快速入门
        基本操作
        运维
        监控
      • 服务月报
        服务月报是帮助客户总结云上资源运行状态,找出痛点问题和优化建议的专业报告。 服务月报是为企业级支持计划客户呈现的资源总体情况、服务总结、云上资源可用性分析、健康状态分析等,帮助客户总结云上资源运行状态,找出痛点问题和优化建议的专业报告。 天翼云在客户加入企业级支持计划次月起提供月报服务,根据客户要求,按需于每月第15个工作日前向客户要求的邮箱发送上月服务月报。 服务月报核心内容包括: 资源总结情况: 各产品线资源数量,月度周期的资源变化量; 服务总结: 月度工单整体情况,重点报障信息及需求跟进情况; 云上资源可用性分析: 识别各产品线风险项,提出优化建议,整改进展和当前状态; 主要云资源和网络健康状态分析: 描述使用概览,月度运行情况,以及提出优化建议; 安全防护: 依据客户使用的安全产品出具安全报表和建议。 注意 在一些特殊情况下,可能因数据采集制约导致天翼云无法生成和发送月报。例如,尚处于上云POC阶段的部署架构可能变动较大不适宜生成月报;专属云特定部署场景也可能导致工具无法采集到月报数据;部分资源池暂时无法对接,月报中部分数据可能存在一定差异。 在输出服务月报的过程中,天翼云需采集客户的基础设施运维数据。所有数据仅用于制作服务月报,不会用于其他任何目的。数据采集类型和用途说明如表1所示。 表1 数据采集类型和用途说明 数据类型 说明 采集和存储方式 数据用途 ::: 服务工单数据 技术类、业务类工单清单。 工单的编号、描述、问题分类、创建时间、解决时间等工单信息。 经自动化工具调用工单API查询结果,中途不存储数据,月报结果按照租户隔离存储。 自动化统计分析,生成月报“服务工单”内容。 云服务资源实例数据 客户创建的资源列表,各资源数量。 资源id、名称、状态、规格、创建时间、IP地址、使用量及服务资源相关的基本配置信息。 经自动化工具调用云服务API查询结果,中途不存储数据,月报结果按照租户隔离存储。 自动化统计分析,生成月报“资源概况”内容。 资源负载监控数据 CPU使用率、内存使用率、磁盘使用率、磁盘读写速率、 IP出口带宽、IP入口带宽、并发连接数、新建连接数、网络延迟、网络丢包率等资源监控指标。 经自动化工具调用云服务API查询结果,中途不存储数据,月报结果按照租户隔离存储。 自动化统计分析,生成月报“资源概况”内容。
        来自:
        帮助文档
        客户支持计划
        产品简介
        服务内容
        服务月报
      • 功能特征指引
        产品服务优势 自动开通 云监控服务无需购买和开通,在云资源创建成功后免费自动开通,您可直接到云监控控制台查看已购产品运行状态并设置告警规则。 全面监控 分钟级采集涵盖所有指标数据,进程级细粒度的指标变化感知能力,及时有效的云产品监控体验,通知随时触发随时响应。 灵活告警 提供自定义告警规则和告警通知功能,支持对多个云资源同时添加告警。告警规则支持随时修改,支持对告警规则进行启用、停止、删除等灵活操作。 实时通知 通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过邮件实时通知用户,让用户能够实时掌握云资源运行状态变化。 历史可查 提供历史查询服务,用户可在控制台一键查询过去云监控产品的监控数据、告警历史数据。监控和告警历史数据均支持系统固定时长和自定义时长方式查看,历史记录回溯时间可长达一个月。 数据可视化 提供自定义监控面板能力,客户可将多个资源集中进行展示;通过多实例、多指标对比分析能力,满足客户各种场景下的监控数据的可视化需求。 产品功能视图 云监控功能资源池生效视图如下: 一级功能 二级功能 帮助文档链接 生效资源池范围 备注 监控概览 查看监控概览 部分资源池 监控面板 查看监控面板 全部资源池 资源分组 使用资源分组 部分资源池 主机监控 使用主机监控 全部资源池 云服务监控 使用云服务监控 全部资源池 云服务监控下特定产品监控需单独配置开通,如弹性文件监控、对象存储监控等 事件监控 系统事件 使用事件监控 部分资源池 网络分析与监控 站点监控 使用站点监控 部分资源池 当前为免费公测阶段,公测结束后会进行计费。具体计费方式关注云监控服务 网络分析与监控 一次性拨测工具 使用一次性拨测工具 全部资源池 告警服务 告警记录 查看告警记录 全部资源池 告警服务 告警模板 使用告警模板 全部资源池 告警服务 告警规则 使用告警规则 全部资源池 告警服务 告警联系人/组 使用告警联系人/组 全部资源池 告警服务 通知模板 使用通知模板 部分资源池 告警服务 告警黑名单 使用告警黑名单 部分资源池 告警服务 一键告警 使用一键告警 全部资源池 告警服务 通知记录 使用通知记录 全部资源池 智能巡检 使用智能巡检 部分资源池 任务中心 使用任务中心 全部资源池 数据订阅 使用数据订阅 部分资源池 当前为免费公测阶段,公测结束后会进行计费。具体计费方式关注云监控服务 套餐管理 告警服务计费总览 部分资源池 短信资源包已支持全部资源池,语音套餐包仅支持部分资源池 说明 "全部资源池"即为开通云监控服务的所有公有云资源池。
        来自:
        帮助文档
        云监控服务
        产品简介
        功能特征指引
      • GRPCClient监控
        指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 方法监控(detail,以方法维度统计接口调用数据。) method method 请求的方法 ENUM LAST 方法监控(detail,以方法维度统计接口调用数据。) concurrentMax 最大并发 该方法的最大并发 INT MAX 方法监控(detail,以方法维度统计接口调用数据。) errorCount 错误数 该方法的错误数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) invokeCount 调用次数 该方法的调用次数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) maxTime 最大响应时间 该方法在采集周期内最大响应时间 INT MAX 方法监控(detail,以方法维度统计接口调用数据。) runningCount 正在执行数 该方法在采集时间点正在执行数量 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range1 010ms 响应时间在010ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range5 110s 响应时间在110s范围请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) range6 10s以上 响应时间在10s以上请求数 INT SUM 方法监控(detail,以方法维度统计接口调用数据。) totalTime 总响应时间 该方法的总响应时间 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) clusterId 集群id 调用方的集群id ENUM LAST 集群调用(cluster,以调用方集群id维度统计接口调用数据。) invokeCount 调用次数 该集群的调用次数 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) totalTime 总响应时间 该集群调用的总响应时间 INT SUM 集群调用(cluster,以调用方集群id维度统计接口调用数据。) errorCount 错误次数 该集群调用的错误次数 INT SUM
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        远程过程调用
        GRPCClient监控
      • 计费价格
        本章节主要介绍翼MapReduce服务的产品价格。 翼MapReduce集群费用由翼MapReduce服务管理费用和硬件产品费用组成,硬件产品费用由主机费用和硬盘费用组成。 硬件价格 云主机价格 系列 型号 产品 按需价格(元/小时) 包月价格(元/月) 通用云主机 通用型S7 vCPU(核) 0.095 45.69 通用云主机 通用型S7 内存(GB) 0.034 16.31 通用云主机 通用计算增强型C7 vCPU(核) 0.152 73 通用云主机 通用计算增强型C7 内存(GB) 0.029 14 通用云主机 内存优化型M7 vCPU(核) 0.124 58.43 通用云主机 内存优化型M7 内存(GB) 0.029 14 通用云主机 通用型S8 vCPU(核) 0.096 46 通用云主机 通用型S8 内存(GB) 0.035 17 通用云主机 通用计算增强型C8 vCPU(核) 0.154 74 通用云主机 通用计算增强型C8 内存(GB) 0.029 14 通用云主机 内存优化型M8 vCPU(核) 0.125 60 通用云主机 内存优化型M8 内存(GB) 0.029 14 国产云主机鲲鹏 通用型ks1 vCPU(核) 0.1084 52 国产云主机鲲鹏 通用型ks1 内存(GB) 0.0313 15 国产云主机鲲鹏 计算增强型kc1 vCPU(核) 0.2167 104 国产云主机鲲鹏 计算增强型kc1 内存(GB) 0.0313 15 国产云主机鲲鹏 内存优化型km1 vCPU(核) 0.2167 104 国产云主机鲲鹏 内存优化型km1 内存(GB) 0.0313 15 国产云主机海光 通用型hs1 vCPU(核) 0.0938 45 国产云主机海光 通用型hs1 内存(GB) 0.0333 16 国产云主机海光 计算增强型hc1 vCPU(核) 0.1854 89 国产云主机海光 计算增强型hc1 内存(GB) 0.0292 14 国产云主机海光 内存优化型hm1 vCPU(核) 0.1854 89 国产云主机海光 内存优化型hm1 内存(GB) 0.0292 14 国产云主机海光 计算增强型hc3 vCPU(核) 0.1854 89 国产云主机海光 计算增强型hc3 内存(GB) 0.0292 14 国产云主机海光 内存优化型hm3 vCPU(核) 0.1854 89 国产云主机海光 内存优化型hm3 内存(GB) 0.0292 14 备注:1年8.5折。
        来自:
        帮助文档
        翼MapReduce
        计费说明
        计费价格
      • 创建告警规则
        本文介绍如何根据需求自定义设置告警规则。 操作场景 您可以在云监控产品控制台为VPN连接产品设置告警规则,当资源的监控指标达到告警条件,云监控将向您发送告警消息,报告异常监控数据,帮助您及时掌握异常状态并处理,保障业务顺畅运行。 前提条件 您在该区域下有正常状态的VPN资源;如果资源状态异常,可能会没有监控数据,无法触发告警。 操作步骤 1. 登录控制中心。 2. 选择“管理与部署”下的“云监控”产品。 3. 选择“告警服务 ”下的“告警规则”,进入告警规则页面。 4. 在告警规则页面,单击右上角的“创建告警规则”按钮,进入创建告警规则页面。 5. 在“选择监控对象”部分,规则类型选择“指标监控”,云服务选择“VPN”,维度可选“VPN网关、IPsec连接、SSL客户端、SSL网关”,监控对象类型选择“具体实例”,监控对象可以从弹出对话框列表中按需选择。如果您是通过点击具体监控指标操作列中的“创建告警规则”按钮跳转到创建告警规则页面的,则此部分内容会自动填充为关联监控对象,无法调整。 6. 在“选择监控指标”部分,选择类型为“自定义创建”,针对于不同的监控指标,可以配置不同的监控策略,如监控入方向流量速率的最大值、监控出方向数据包速率的最小值、监控SSL客户端连接数的原始值等,配置策略、聚合周期和出现次数之后,即可产生告警,在“告警服务”下的“告警记录”中可以查看告警记录。如果开启发送通知还需要配置告警联系组等选项,用于将告警以邮件或短信方式通知告警联系人。 7. 在“规则信息”部分,需要填入告警规则名称,选择企业项目,可选填写描述信息。 8. 最后,点击“确定”完成告警规则的创建。
        来自:
        帮助文档
        VPN连接
        用户指南
        监控告警
        创建告警规则
      • 监控面板:视图监控项校验
        接口功能介绍 一个监控视图包含一个或多个监控项,监控项为keyvalue格式。 校验指定监控视图中的监控项 Key 是否存在。 接口约束 regionID(资源池)、templateID(监控面板)、viewID(监控视图)存在。 URI GET /v4/monitor/checkmonitoritem 请求参数 Query参数 参数 参数类型 是否必填 示例 说明 下级对象 regionID String 是 81f7728662dd11ec810800155d307d5b 资源池ID templateID String 是 466d5eb4484311eda9b7005056897257 监控面板ID viewID String 是 4cb790ae489411edb386005056897257 监控视图ID itemKey String 是 key1 监控项Key 响应参数 参数 参数类型 说明 示例 下级对象 statusCode Integer 返回状态码(800为成功,900为失败),默认值:800 800 errorCode String 失败时的错误代码,参见公共错误码说明 message String 失败时的错误描述,一般为英文描述 Success msgDesc String 失败时的错误描述,一般为中文描述 成功 returnObj Object 返回对象 returnObj 表returnObj 参数 参数类型 说明 示例 下级对象 exist Boolean 是否存在给定监控项Key true
        来自:
        帮助文档
        云监控服务
        API参考
        API
        监控服务
        监控面板
        监控面板:视图监控项校验
      • 查看监控指标
        本节主要介绍查看监控指标 云监控可以对文档数据库服务的运行状态进行日常监控。您可以通过管理控制台,直观地查看文档数据库服务的各项监控指标。 由于监控数据的获取与传输会花费一定时间,因此,云监控显示的是当前时间5~10分钟前的监控状态。如果您的实例刚刚创建完成,请等待5~10分钟后查看监控数据。 前提条件 文档数据库实例正常运行。 故障或已删除的文档数据库实例或节点,无法查看其监控指标。当再次启动或恢复后,即可正常查看。 文档数据库实例已正常运行一段时间(约10分钟)。 对于新创建的文档数据库实例,需要等待一段时间,才能查看上报的监控数据和监控视图。 如需开通高级运维权限,您可以工单提交开通秒级监控权限的申请。 操作步骤 步骤 1 登录管理控制台。 步骤 2 单击管理控制台左上方的,选择区域和项目。 步骤 3 在页面左上角单击,选择“数据库 > 文档数据库服务 DDS”,进入文档数据库服务信息页面。 步骤 4 在“实例管理”页面,选择指定的实例,单击实例名称。 步骤 5 在左侧导航树,单击“高级运维”。 步骤 6 查看监控指标。 对于集群实例,支持查看实例级别、mongos节点、shard节点和config节点级别的指标。 查看集群实例的监控指标 对于副本集实例,支持查看Primary节点、Secondry节点和Hidden节点级别的指标。 查看副本集实例的监控指标 步骤 7 在监控指标区域,您可以选择监控时长,查看对应时间段的监控数据。支持查看文档数据库服务近1小时、近3小时和近12小时的监控数据。 开启自动刷新 开启“自动刷新”开关后,可自动刷新监控数据,刷新周期为60s。 更多指标信息,可单击“查看更多指标详情”,跳转到云监控界面查看。
        来自:
        帮助文档
        文档数据库服务
        用户指南
        监控与告警
        查看监控指标
      • 查看监控详情
        本节介绍如何查看监控详情。 1. 点击监控任务列表中监控任务行中的监控详情“查看”按扭,自动弹出“监控详情”页面。 2. “监控详情”页面动态展示最近1小时监控任务可用性比率变化曲线,以及电信、联通、移动三家运营商最近一小时探测情况。
        来自:
        帮助文档
        云解析
        用户指南
        域名监控管理
        查看监控详情
      • 查看共享带宽监控
        查看共享带宽和弹性公网IP的使用状况时,您可以获取特定时间段内的入网带宽、出网带宽、入网流量以及出网流量等详细使用数据。本文帮助您了解如何查阅共享带宽的监控细节。 通过共享带宽控制台 1. 登录网络控制台。 2. 在顶部菜单栏处,选择地域。 3. 在左侧导航栏单击共享带宽,进入共享带宽页面。 4. 在共享带宽列表中找到您想查看目标共享带宽,在“操作>更多>查看监控图表”。 5. 可以查看出入网流量、出入网带宽。 通过云监控控制台 1. 登录云监控控制台。 2. 顶部菜单栏处,选择地域。 3. 在左侧导航栏,单击“云服务监控”。 4. 在左侧导航栏,单击云服务监控>弹性IP监控,然后选择共享带宽列表项。 5. 在目标共享带宽实例操作列,单击“查看监控图表”,查看监控数据。 本功能仅在部分资源池可 见,请以控制台实际可见为准。
        来自:
        帮助文档
        共享带宽 SBW
        用户指南
        运维与监控
        查看共享带宽监控
      • 使用定时触发器
        本章介绍函数工作流如何使用定时触发器。 本节介绍创建定时触发器,按照设置的频率,定期触发函数运行,供用户了解定时触发器的使用方法。 前提条件 已经创建函数。 创建定时触发器 1、登录函数工作流控制台,在左侧的导航栏选择“函数 > 函数列表”。 2、选择待配置的函数,单击进入函数详情页。 3、选择“设置 > 触发器”,单击“创建触发器”,弹出“创建触发器”对话框。 创建触发器 4、设置以下信息。 触发器类型:选择“定时触发器 (TIMER)”。 定时器名称:您自定义的定时器名称,例如:Timer。 触发规则:固定频率和Cron表达式。 固定频率:固定时间间隔触发函数,该类型下支持配置单位为分、时、天,每种类型仅支持整数配置,其中分钟支持范围(0,60],小时支持范围(0,24],天支持范围(0,30]。 Cron表达式:设置更为复杂的函数执行计划,例如:周一到周五上午08:30:00执行函数等,具体请参见附录:函数定时触发器Cron表达式规则。 是否开启:是否开启定时触发器。 附加信息:如果用户配置了触发事件,会将该事件填写到TIMER事件源的“userevent”字段。 5、单击“确定”,完成定时触发器的创建。 查看函数运行结果 1、函数的定时触发器创建以后,每隔一分钟执行一次函数,可以查看函数运行日志。 2、登录函数工作流控制台,在左侧的导航栏选择“函数 > 函数列表”。 3、选择函数,单击进入函数详情页。 4、选择“监控 > 日志”,查询函数运行日志。
        来自:
        帮助文档
        函数工作流
        用户指南
        配置触发器
        使用定时触发器
      • 删除监控视图
        操作步骤 1. 登录管理控制台。 2. 单击“服务列表 > 云监控服务”。 3. 单击页面左侧的监控面板。 4. 选择需要删除监控视图所在的监控面板。 5. 在待删除的“监控视图”区域,鼠标滑过视图时单击区域右上角的删除图标。 在弹出的删除监控视图页面,选择“是”即可删除该监控视图。
        来自:
        帮助文档
        云监控服务
        用户指南
        使用监控面板
        删除监控视图
      • RabbitMqConsumer监控
        本文主要介绍RabbitMqConsumer监控 介绍APM采集的RabbitMqConsumer监控指标的类别、名称、含义等信息。 表 调用接口指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: 异常 (exception,RabbitMqConsumer调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常 (exception,RabbitMqConsumer调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常 (exception,RabbitMqConsumer调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常 (exception,RabbitMqConsumer调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常 (exception,RabbitMqConsumer调用的异常信息统计。) stackTrace 异常堆栈 该异常产生的堆栈信息 CLOB LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) pushConsumeIdentifier identifier 推模式消费标识 ENUM LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) concurrentMax 最大并发 消费消息最大并发 INT MAX 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) errorCount 错误次数 消费消息的错误次数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) invokeCount invokeCount Consume调用次数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) consumedMsgCount consumedMsgCount 消费消息数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) consumedBytes 消费字节数 消费字节数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 INT MAX 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) manualAckCount ack消息数 ack消息数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) rejectCount reject消息数 reject消息数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) requeueCount requeue消息数 requeue消息数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) lastError 错误信息 消费消息发生错误产生的错误信息 STRING LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) maxTime 最大响应时间 消费消息的最大响应时间 INT MAX 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) runningCount 正在执行数 采集时间点正在执行的消费消息数量 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) totalTime 总响应时间 消费消息的总响应时间 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range5 110s 响应时间在110s范围请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM 推模式消费维度监控(pushConsume,以推模式为维度统计消息消费详情。) unackedMsgCount 未确认消息数(Channel) 该channel中未确认的消息数 INT LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) connection connection consumer连接信息 ENUM LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) connectionCount 当前连接数 当前连接数 INT LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) channelCount 当前Channel数 当前Channel数 INT LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) connectionCreated 创建连接数 创建连接数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) connectionClosed 销毁连接数 销毁连接数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) channelCreated 创建Channel数 创建Channel数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) channelClosed 销毁Channel数 销毁Channel数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) concurrentMax 最大并发 消费消息最大并发 INT MAX connection监控(connectionConsume,以connection为维度统计消息消费详情。) errorCount 错误次数 消费消息的错误次数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) invokeCount invokeCount Consume调用次数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) consumedMsgCount consumedMsgCount 消费消息数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) consumedBytes 消费字节数 消费字节数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 INT MAX connection监控(connectionConsume,以connection为维度统计消息消费详情。) manualAckCount ack消息数 ack消息数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) rejectCount reject消息数 reject消息数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) requeueCount requeue消息数 requeue消息数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) lastError 错误信息 消费消息发生错误产生的错误信息 STRING LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) maxTime 最大响应时间 消费消息的最大响应时间 INT MAX connection监控(connectionConsume,以connection为维度统计消息消费详情。) runningCount 正在执行数 采集时间点正在执行的消费消息数量 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST connection监控(connectionConsume,以connection为维度统计消息消费详情。) totalTime 总响应时间 消费消息的总响应时间 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range5 110s 响应时间在110s范围请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM connection监控(connectionConsume,以connection为维度统计消息消费详情。) unackedMsgCount 未确认消息数 该连接中未确认的消息数 INT LAST total监控(total,以客户端为维度统计消息消费详情。) concurrentMax 最大并发 消费消息最大并发 INT MAX total监控(total,以客户端为维度统计消息消费详情。) errorCount 错误次数 消费消息的错误次数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息消费详情。) invokeCount invokeCount Consume调用次数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) consumedMsgCount consumedMsgCount 消费消息数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) consumedBytes 消费字节数 消费字节数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) maxSingleMsgBytes 单次消费最大字节数 单次消费最大字节数 INT MAX total监控(total,以客户端为维度统计消息消费详情。) manualAckCount ack消息数 ack消息数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) rejectCount reject消息数 reject消息数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) requeueCount requeue消息数 requeue消息数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) lastError 错误信息 消费消息发生错误产生的错误信息 STRING LAST total监控(total,以客户端为维度统计消息消费详情。) maxTime 最大响应时间 消费消息的最大响应时间 INT MAX total监控(total,以客户端为维度统计消息消费详情。) runningCount 正在执行数 采集时间点正在执行的消费消息数量 INT SUM total监控(total,以客户端为维度统计消息消费详情。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST total监控(total,以客户端为维度统计消息消费详情。) totalTime 总响应时间 消费消息的总响应时间 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range3 100200ms 响应时间在100200ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range4 2001000ms 响应时间在2001000ms范围请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range5 110s 响应时间在110s范围请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM total监控(total,以客户端为维度统计消息消费详情。) unackedMsgCount 未确认消息数 该客户端中未确认的消息数 INT LAST
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        消息队列
        RabbitMqConsumer监控
      • 产品功能
        本节主要介绍产品功能 应用监控 应用监控是针对资源和应用的监控,通过应用监控您可以及时了解应用的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证应用流畅运行。 应用监控是逐层下钻设计,层次关系为:应用列表>应用详情>组件详情>实例详情>容器详情>进程详情。即在应用监控中,将应用、组件、实例、容器、进程做了层层关联,在界面上就可以直接得知各层关系。 主机监控 主机监控是针对主机的监控,通过主机监控您可以及时了解主机的资源使用情况、趋势和告警,使用这些信息,您可以快速响应,保证主机流畅运行。 主机监控的设计类似应用监控,主机的层级关系为:主机列表>主机详情。详情页面包含了当前主机上所发现的所有实例,显卡,网卡,磁盘,文件系统和告警。 应用自动发现 您在主机上部署应用后,在主机上安装的ICAgent将自动收集应用信息,包括进程名称,组件名称,容器名称,Kubernetes pod名称等,自动发现的应用在界面上以图形化方式展示,支持您自定义别名和分组对资源进行管理 仪表盘 通过仪表盘可将不同图表展示到同一个屏幕上,通过不同的仪表形式来展示资源数据,例如,曲线图、数字图等,进而全面、深入地掌握监控数据。 例如,可将重要资源的关键指标添加到仪表盘中,从而实时地进行监控。还可将不同资源的同一指标展示到同一个图形界面上进行对比。另外,对于例行运维需要查看的指标,可添加到仪表盘中,以便再次打开AOM时无需重新选择指标就可进行例行检查任务。
        来自:
        帮助文档
        应用运维管理
        产品简介
        产品功能
      • 可观测性
        本文介绍可观测性相关操作。 容器引擎服务目前提供了总体资源的基础监控能力。用户可通过点击控制导航栏处的【总览】,进入总览界面,查看汇总的资源信息。也可单独查看各个应用、容器的相关信息。 操作步骤 总览界面查看使用CCE的相关信息,需首先选择当前集群,将展现选择集群的以下信息: 节点、应用、容器组、服务、ingress的数量统计数量; 监控管理:提供集群监控信息,包括网络速率,及磁盘、cpu、内存类型的资源利用率; 组件状态监控:提供API server、Controller Managers、Scheduler组件状态监控; 用户也可以通过点击【资源管理】>【集群管理】等入口,获得各应用状态及监控信息,同时可查看集群及容器日志: 监控:无状态应用及容器组运行情况,包括正常与异常两种状态; 应用资源使用量监控:记录当前的资源使用量,包括CPU使用量、内存使用量; 应用事件:记录应用事件,包括发生次数、事件、类型、消息内容等; 容器组日志:提供容器内部的日志信息; 容器事件:记录容器事件,包括发生次数、事件、类型、消息内容等; 集群日志:提供集群创建过程中的日志信息; 集群监控:提供cpu、内存、磁盘使用率指标及网络上下行速率监控指标查看; 节点监控:提供cpu、内存、磁盘使用率指标及网络上下行速率监控指标查看; 节点事件:记录容器事件,包括发生次数、事件、类型、消息内容等。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        可观测性
      • 关于日志
        操作类型 操作 用户管理 创建用户 修改用户 删除用户 创建组 修改组 删除组 添加角色 修改角色 删除角色 密码策略修改 修改密码 密码重置 用户登录 用户注销 屏幕解锁 下载认证凭据 用户越权操作 用户帐号解锁 用户帐号锁定 屏幕锁定 导出用户 导出用户组 导出角色 集群 启动集群 停止集群 重启集群 滚动重启集群 重启所有过期实例 保存配置 同步集群配置 定制集群监控指标 配置监控转储 保存监控阈值 下载客户端配置 北向Syslog接口配置 北向SNMP接口配置 SNMP清除告警 SNMP添加trap目标 SNMP删除trap目标 SNMP检查告警 SNMP同步告警 创建阈值模板 删除阈值模板 应用阈值模板 保存集群监控配置数据 导出配置数据 导入集群配置数据 导出安装模板 修改阈值模板 取消阈值模板应用 屏蔽告警 发送告警 修改OMS数据库密码 重置组件数据库密码 重启OMM和Controller 启动集群的健康检查 导入证书文件 配置SSO信息 删除健康检查历史报告 修改集群属性 同步维护命令 异步维护命令 定制报表监控指标 导出报表监控数据 SNMP执行异步命令 重启WEB服务 定制静态资源池监控指标 导出静态资源池监控数据 定制主页监控指标 中止任务 还原配置 修改域和互信的配置 修改系统参数 集群进入维护模式 集群退出维护模式 OMS进入维护模式 OMS退出维护模式 批量退出维护模式 修改OMS配置 启用阈值告警 同步所有集群配置 服务 启动服务 停止服务 同步服务配置 刷新服务队列 定制服务监控指标 重启服务 滚动重启服务 导出服务监控数据 导入服务配置数据 启动服务的健康检查 服务配置 上传配置文件 下载配置文件 同步实例配置 实例入服 实例退服 启动实例 停止实例 定制实例监控指标 重启实例 滚动重启实例 导出实例监控数据 导入实例配置数据 创建实例组 修改实例组 删除实例组 移动到另一个实例组 服务进入维护模式 服务退出维护模式 修改服务显示名称 修改服务关联关系 下载监控数据 屏蔽告警 取消屏蔽告警 导出服务的报表数据 添加报表的自定义参数 修改报表的自定义参数 删除报表的自定义参数 倒换控制节点 新增挂载表 修改挂载表 主机 设置节点机架 启动所有角色 停止所有角色 隔离主机 取消隔离主机 定制主机监控指标 导出主机监控数据 主机进入维护模式 主机退出维护模式 导出主机基本信息 导出主机分布的报表数据 导出主机趋势的报表数据 导出主机集群的报表数据 导出服务的报表数据 定制主机集群监控指标 定制主机趋势监控指标 告警 导出告警 清除告警 导出事件 批量清除告警 采集日志 采集日志文件 下载日志文件 采集服务堆栈信息 采集实例堆栈信息 准备服务堆栈信息 准备实例堆栈信息 清理服务堆栈信息 清理实例堆栈信息 审计日志 修改审计转储配置 导出审计日志 备份恢复 创建备份任务 执行备份任务 批量执行备份任务 停止备份任务 删除备份任务 修改备份任务 锁定备份任务 解锁备份任务 创建恢复任务 执行恢复任务 停止恢复任务 重试恢复任务 删除恢复任务 多租户 保存静态配置 添加租户 删除租户 关联租户服务 删除租户服务 配置资源 创建资源 删除资源 增加资源池 修改资源池 删除资源池 恢复租户数据 修改租户全局配置 修改容量调度器队列配置 修改超级调度器队列配置 修改容量调度器资源分布 清除容量调度器资源分布 修改超级调度器资源分布 清除超级调度器资源分布 添加资源目录 修改资源目录 删除资源目录 定制租户监控指标 健康检查 启动集群的健康检查 启动服务的健康检查 启动主机的健康检查 启动oms健康检查 启动系统的健康检查 更新健康检查的配置 导出健康检查报告 导出集群健康检查的结果 导出服务健康检查的结果 导出主机健康检查的结果 删除健康检查历史报告 导出健康检查历史报告 下载健康检查报告
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        日志管理
        关于日志
      • 帐户维护建议
        本章主要介绍翼MapReduce的帐户维护建议功能。 建议系统管理员对帐户例行检查,检查的内容包括: 操作系统、FusionInsight Manager以及各组件的帐户是否有必要,临时帐户是否已删除。 各类帐户的权限是否合理。不同的管理员拥有不同的权限。 对各类帐户的登录、操作记录进行检查和审计。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        安全管理
        安全维护
        帐户维护建议
      • Prometheus 监控
        本节介绍Prometheus监控。 前提条件 分布式容器云平台的集群监控已对接应用性能监控。 已创建注册集群,具体操作参见 注册集群。 操作步骤 开启Prometheus监控 登录分布式容器云平台,进入集群管理页。 在集群管理页点击需要查看监控的注册集群,进入集群信息页面。 在注册集群详情页面选择 运维管理>Prometheus监控,若未开通Prometheus监控服务,请按照页面指引进行 委托受理 >开通应用性能监控>打通应用性能监控网络访问>安装cubeprometheus插件。 完成操作之后即可进入Prometheus监控页面,查看分布式容器云平台提供的预设Grafana面板,包括集群概览、核心组件、节点、应用和网络监控,用户可对预设面板进行修改,根据需求定制自己的监控面板。 工作负载接入监控 登录应用性能监控控制台,点击进入Prometheus监控>接入管理,点击已接入环境对应的单集群。 在单集群对应的接入管理详情页面,进入指标采集>功能启用,启用后开始收费,对自定义指标上报,使用ServiceMonitor或PodMonitor服务发现方式进行指标上报。 新增ServiceMonitor shell apiVersion: monitoring.coreos.com/v1 kind: ServiceMonitor metadata: name: servicemonitor1 namespace: ns1 annotations: arms.prometheus.io/discovery: 'true' spec: endpoints: interval: 60s port: metrics 对应Service中定义的端口名称 path: /metrics namespaceSelector: any: true 监控所有命名空间 selector: matchLabels: app: app1 或者选用新增PodMonitor shell apiVersion: monitoring.coreos.com/v1 kind: PodMonitor metadata: name: podmonitor1 namespace: ns1 annotations: arms.prometheus.io/discovery: 'true' spec: selector: matchLabels: app: app1 匹配目标pod的标签 namespaceSelector: any: true podMetricsEndpoints: interval: 60s targetPort: 8080 path: /metrics 验证监控指标上报情况,在指标探索页进行搜索对应指标。
        来自:
        帮助文档
        分布式容器云平台 CCE One
        用户指南
        注册集群
        注册集群控制台
        运维
        Prometheus 监控
      • 设置告警规则
        参数 参数说明 取值样例 资源类型 配置告警规则监控的服务名称。 弹性云主机 维度 用于指定告警规则对应指标的维度名称 云服务器 监控范围 告警规则适用的资源范围,可选择资源分组或指定资源。 说明 当选择资源分组时,该分组下任何资源满足告警策略时,都会触发告警通知。 选择指定资源时,勾选具体的监控对象,单击 将监控对象同步到右侧对话框。 指定资源 选择分组 当监控范围为资源分组时需配置此参数。 选择类型 根据需要可选择从模板导入或自定义创建。 说明 当监控范围为指定资源时可选择从模板导入。 自定义创建 模板 选择需要导入的模板。 告警策略 触发告警规则的告警策略。 当资源类型选择站点监控、日志监控、自定义监控、具体的云服务时,告警策略为一个周期性的动作。当资源类型选择事件监控时,具体的事件为一个瞬间的操作动作,而不是周期性动作。 例如:CPU使用率,监控周期为5分钟,连续三个周期平均值≥80% 挂载点 当监控指标为细颗粒度的磁盘类监控指标时需配置该参数。 Windows系统请输入对应的驱动器号,比如C、D或者E等,Linux系统请输入对应的挂载点,比如/dev、/opt等。 /dev 告警级别 根据告警的严重程度不同等级,可选择紧急、重要、次要、提示。 重要
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        云监控服务
        设置告警规则
      • 数据库
        本文主要介绍数据库 数据库监控项可以对数据库的访问进行监控,可以监控的数据库包含C3P0连接池、Cassandra、ClickHouse、DBCP、Druid、EsRestClient、GaussDb、Hikari连接池、Jetcd、ObsClient、MySQL、Postgresql、Oracle、HBase 以及MongoDB多种类型。对于数据库的监控,APM系统会采集具体的执行语句详情,方便用户定位代码级的性能问题。 查看数据库监控 步骤 1 登录管理控制台。 步骤 2 单击左侧,选择“应用性能管理 APM”,进入APM服务页面。 步骤 3 在左侧导航栏选择“应用监控 > 指标”。 步骤 4 在界面左侧树单击待查看接口调用的环境后的。 步骤 5 单击“数据库”,切换至数据库页签。默认展示“全部实例”的“Mysql数据库”信息。 步骤 6 在数据库页签选择您想要查看的“实例名称”和“指标选择”,可以查看该实例在对应采集器下的不同指标集下的应用监控数据。 查看Mysql数据库监控 sql维度汇总 APM支持从sql维度对Mysql数据库进行监控,监控的指标包括sql、sql语句、调用次数、平均响应时间、错误次数、调用时间、最慢调用链和错误调用链,您可以单击列表右上角的自定义列表项,使界面上显示您需要查看的指标数据。 单击sql语句可以查看sql语句详情。 单击调用次数、平均响应时间等蓝色字体数值,会以图表的形式显示对应的数值详情。 单击某个最慢调用链或者错误调用链,系统会跳转到该调用链详情页面,查看该调用链的调用情况。
        来自:
        帮助文档
        应用性能管理
        用户指南
        应用指标监控
        应用监控详情
        数据库
      • 修改Pushgateway监控配置
        本节主要介绍修改Pushgateway监控配置命令。 ./stor config set { i item } monitor pushgateway PUSHGATEWAY [ pushgatewaylabels LABEL & ] [ all ] [ pushgatewaytimeout PUSHGATEWAYTIMEOUT ] [ collectinterval COLLECTINTERVAL ] [ collectmetric COLLECTMETRIC [ collectmetricitems ITEM & ] ] [ { n server } SERVERID & ] 此命令用来修改Pushgateway监控配置。 说明 不建议修改默认携带的label:job、集群ID、集群名称、ServerIP、hostname。 参数 参数 描述 pushgateway PUSHGATEWAY 需要修改Pushgateway监控配置的地址和接口,格式为IPv4 :port 、[IPv6 ]:port 或者domainname :port。 pushgatewaylabels LABEL Pushgateway对应的标签值,格式为KEY:VALUE。一次可以修改多个标签值,以英文逗号(,)分开。 all 覆盖所有的labels或者所有的metric 配置。如果pushgatewaylabels LABEL 或 collectmetricitems ITEM未指定,此参数不生效。 pushgatewaytimeout PUSHGATEWAYTIMEOUT 指定向Pushgateway发送数据的超时时间。 取值:如果单位是s,取值为[1, 1000]范围的整数;如果单位是ms,取值为[1000, 1000000]范围的整数。默认单位是s。 collectinterval COLLECTINTERVAL 指定采集时间间隔。 取值:如果单位是s,取值为负整数、[2, 1000]范围的整数;如果单位是ms,取值为负整数、[2000, 1000000]范围的整数。默认单位是s。 注意 如果与collectmetric COLLECTMETRIC同时指定时,取值可以为负整数,表示不采集指定的监控指标。 如果不指定collectmetric COLLECTMETRIC时,表示设置所有监控指标的采集间隔,取值只能是允许范围内的正整数。 collectmetric COLLECTMETRIC 指定采集的监控指标。 取值为:server、fileSystem、interface、load、disk、tcp、os。 默认采集的上述所有监控指标。 collectmetricitems ITEM 指定监控指标下的配置项,目前仅监控指标disk、fileSystem、interface可以指定配置项。 说明 如果指定collectMetric,未指定配置项,默认修改指定collectMetric下的所有配置项。 如果未指定collectMetric,不能指定此参数。 n SERVERID 或 server SERVERID 指定要修改Pushgateway监控配置的HBlock服务器ID。一次可以修改多个HBlock服务器的Pushgateway监控配置,以英文逗号(,)分开。 默认修改所有HBlock服务器的Pushgateway监控配置。
        来自:
        帮助文档
        存储资源盘活系统
        命令行参考
        HBlock系统设置
        Pushgateway监控配置
        修改Pushgateway监控配置
      • 产品功能
        一级分类 二级分类 功能点 功能点描述 核心功能 集群 一键快速部署 支持界面化订购,自动开通Kubernetes集群,兼容原生Kubernetes 核心功能 集群 节点管理 支持界面化进行扩缩容,支持节点标签、调度设置 核心功能 集群 命名空间 支持资源配额设置、支持网络隔离设置 核心功能 集群 运行时 支持Docker、Containerd 核心功能 工作负载 生命周期管理 支持应用创建、启停、扩缩容、注销等生命周期操作 核心功能 工作负载 工作负载 支持界面化发布有状态、无状态、守护进程、任务、定时任务等工作负载 核心功能 工作负载 多容器 支持一个Pod中发布多个容器,支持设置特权级容器 核心功能 工作负载 探针 支持界面化自定义策略检测应用的可用性 核心功能 工作负载 滚动升级 支持业务不中断平滑升级 核心功能 工作负载 亲和性/反亲和 支持主机及应用的亲和性与反亲和性调度 核心功能 工作负载 资源管控 支持容器级别的资源需求和限额设置,防止资源的浪费 核心功能 弹性调度 Pod弹性伸缩 支持自动伸缩规则设置,基于CPU/内存等资源自动伸缩应用,支持HPA、CronHPA和基于事件的弹性策略 核心功能 弹性调度 节点弹性伸缩 支持节点弹性伸缩 核心功能 弹性调度 负载感知调度 支持调度Pod时考虑节点的实际负载 核心功能 路由 多协议支持 支持TCP、UDP、HTTP以及HTTPS等协议 核心功能 路由 Service支持 支持NodePort、ClusterIP,LB等对外提供访问、支持无头服务 核心功能 路由 Ingress支持 支持Nginx Ingress 核心功能 路由 灰度/蓝绿发布 支持支持灰度/蓝绿发布,支持应用的多个版本在线运行 核心功能 配置管理 配置项 支持配置项 核心功能 配置管理 Secret 支持保密字典、凭证等 核心功能 网络 网络插件 支持高性能网络插件Calico 核心功能 网络 网络插件 支持自研网络插件CubeCNI实现容器与虚拟机网络直通 核心功能 网络 网络策略 支持容器访问策略和流控限制 核心功能 存储 多类型存储 支持Local、NFS、Ceph常见持久存储类;支持csi驱动程序,集成天翼云的云硬盘、弹性文件、对象存储等云存储 核心功能 存储 持久卷声明 支持界面化创建持久卷声明,支持监控存储使用量 核心功能 存储 持久卷 支持界面化创建持久卷,支持持久卷的动态生成 核心功能 日志管理 日志中心 支持容器日志的采集、存储和检索,支持集成三方开源日志解决方案 核心功能 监控与告警 监控中心 支持集群、节点、容器多级别的监控与告警配置,支持审计日志,支持集成三方开源监控解决方案 核心功能 系统管理 接入平台 作为平台组件对外提供服务,支持订单方式进行集群的开通、扩缩容、删除等 核心功能 系统管理 权限管理 多租户支持,租户资源隔离,用户角色授权,支持集群和命名空间的授权 高级功能 应用 插件市场 支持通过Chart对插件打包发布到插件市场,界面化一键部署监控等插件,通过插件与其他产品集成 高级功能 应用 模板市场 支持通过Chart对应用打包发布到模板市场,界面化安装部署等 高级功能 应用 有状态应用 支持挂载持久化存储,实现有状态应用容器化部署 高级功能 能力开放 OpenAPI 支持开放API,对接持续集成和私有部署系统 高级功能 高可用部署 Kubernetes高可用 支持Kubernetes高可用部署 容器镜像服务 镜像 镜像仓库 支持对接多镜像中心,支持界面化创建仓库 容器镜像服务 镜像 租户隔离 支持公开仓库的可见性及私有仓库的不可见性 容器镜像服务 镜像 镜像管理 支持管理海量镜像,支持多版本镜像 容器镜像服务 镜像 镜像收藏 支持快速检索镜像并收藏 容器安全 授权 权限管理 支持基于k8s RBAC授权 容器安全 配置安全 容器安全策略 支持SecurityContext配置
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        产品介绍
        产品功能
      • 云主机支持的操作系统监控指标(安装监控Agent)
        前提条件 请确保您的云主机上已成功安装监控Agent。具体操作,请参见安装监控Agent。 监控指标说明 安装监控Agent后,您可以查看不同分类的操作系统监控指标,采集频率均为1分钟/次。 操作系统监控指标已支持:CPU相关监控指标、内存相关监控指标、CPU负载相关监控指标、磁盘相关监控指标、磁盘I/O相关监控指标、文件系统相关监控项、网络相关监控项、GPU相关监控指标。 说明 监控指标采集信息包含云主机 uuid、hostname(实例名称)等参数。若通过控制台或 OpenAPI 修改了云主机 hostname,需重启云主机后,监控采集的相关信息才会更新。 CPU相关监控指标 监控指标 监控指标名称 监控指标含义 单位 维度 监控周期 CPU使用率 cpuutil 采集周期内云主机实时占用的 CPU 百分比。 Linux:通过读取系统/proc/stat计算得出。 Windows:通过 GetSystemTimes获取。 % 云主机 1分钟 用户空间CPU使用率 cpuusertime 采集周期内云主机用户空间占用CPU使用率。 Linux:通过读取系统/proc/stat计算得出。 indows:通过 GetSystemTimes获取。 % 云主机 1分钟 内核空间CPU使用率 cpusystemtime 采集周期内云主机内核空间占用CPU使用率。 Linux:通过读取系统/proc/stat计算得出。 indows:通过 GetSystemTimes获取。 % 云主机 1分钟 其他CPU使用率 othercpuutil 采集周期内云主机其他占用CPU使用率。 通过“其他CPU使用率1 空闲CPU使用率 内核空间CPU使用率 用户空间CPU使用率” 计算得出。 % 云主机 1分钟 CPU空闲时间占比 cpuidletime 采集周期内云主机CPU空闲时间占比。 Linux:通过读取系统/proc/stat计算得出。 Windows:通过 GetSystemTimes获取。 % 云主机 1分钟 Nice进程CPU使用率 cpunicetime 采集周期内云主机Nice进程CPU使用率。 Linux:通过读取系统/proc/stat计算得出。 Windows:通过 GetSystemTimes获取。 % 云主机 1分钟 iowait状态占比 cpuiowaittime 采集周期内云主机iowait状态占用CPU的比率。 Linux:通过读取系统/proc/stat计算得出。 WWindows:通过 GetSystemTimes获取。 % 云主机 1分钟 CPU中断时间占比 cpuinterrupttime 采集周期内云主机CPU处理中断用时占用CPU时间的百分比。 Linux:通过读取系统/proc/stat计算得出。 Windows:通过 GetSystemTimes获取。 % 云主机 1分钟 CPU软中断时间占比 cpusoftirqtime 采集周期内云主机CPU处理软中断时间占用CPU时间的百分比。 Linux:通过读取系统/proc/stat计算得出。 Windows:通过 GetSystemTimes获取。 % 云主机 1分钟
        来自:
        帮助文档
        弹性云主机 ECS
        用户指南
        监控
        云主机支持的操作系统监控指标(安装监控Agent)
      • 高可用
        参数 配置说明 类型 服务监控:指定Windows系统的服务名称作为监控对象。服务运行时监控正常,服务停止时监控失败。 进程监控:指定系统的进程名称作为监控对象,进程存在时监控正常,进程不存在时监控失败。 内存监控:指定系统的内存使用率作为监控对象,低于阈值时监控正常,高于阈值时监控失败。 CPU监控:根据“CPU使用百分比”参数来作为应用切换的触发条件。 自定义脚本监控:有些场景下,用户要求第三方保护软件监控自定义脚本和“监控结果输出文件”,来作为应用切换的依据。 磁盘监控:根据“指定盘符的磁盘空间使用百分比”来作为应用切换的触发条件。 检测间隔(秒) 选择任何一种监控类型,用户都需要配置检测间隔,默认为2秒;用户根据业务系统RPO要求和环境因素进行调整。 最大失败次数 默认为5次,监控请求但未成功获取对象的运行状态的次数,累积达到5次,drnode程序判定被监控节点对象(服务、进程、内存、CPU、自定义脚本、磁盘)失败。 失败后仅记日志 勾选时,如果监控的对象出现异常,drnode程序只会在日志中产生警告信息,但不进行切换;默认不勾选。 监控角色 用户可以选择监控的角色,分为:主节点、从节点、主从节点,共三个选项:当监控的角色满足监控条件后,高可用规则默认会变为告警状态,如果规则开启了自动切换,则会执行角色切换动作。 服务名称 用户自行填写需要保护的应用对应的服务名。
        来自:
        帮助文档
        多活容灾服务
        用户指南
        资源同步管理
        主机高可用
        高可用
      • 创建告警规则
        本章接入如何创建告警规则。 告警功能提供对监控指标的告警功能,用户可以对弹性文件服务的核心监控指标设置告警规则,当监控指标触发用户设置的告警条件时,支持以邮箱、短信等方式通知用户,让用户在第一时间得知云服务发生异常,迅速处理故障,避免因资源问题造成业务损失。 创建告警规则 1. 登录管理控制台。 2. 单击“管理与部署 > 云监控 > 云服务监控 > 弹性文件服务”或“管理与部署 > 云监控 > 云服务监控 ” 。 3. 选择目标文件系统,单击“操作”列下的“创建告警规则”。 4. 在“创建告警规则”界面,根据界面提示配置参数。 说明 监控对象为弹性文件服务时仅支持通过ID搜索,不支持名称搜索。 5. 选择监控对象,根据界面提示配置参数,如下表所示。然后单击“下一步”。 参数 参数说明 取值样例 资源类型 配置告警规则监控的服务名称。 弹性文件服务 维度 用于指定告警规则对应指标的维度名称 文件系统 监控对象 用来配置该告警规则针对的具体资源,可以是一个或多个。 6. 选择监控指标,选择“从模板导入”,参照下表完成参数配置。 参数 参数说明 取值样例 选择类型 选择从模板导入。 从模板导入 模板 选择需要导入的模板。 发送通知 配置是否发送邮件、短信通知用户,可以选择“是” (推荐选择)或者“否”。选择“否”,就不会发送邮件、短信通知用户,选择“是”,就需要选择已有的主题或者新建主题。 是 发送通知 配置是否发送邮件、短信、通知用户。 选择“是”(推荐选择),会发送通知;选择“否”,不会发送通知。 是 通知对象 需要发送告警通知的主题名称。 当发送通知选择“是”时,需要选择已有的主题名称,若此处没有需要的主题则需先创建主题。 触发条件 可以选择出现告警、恢复正常,作为说明触发告警的条件。 7. 规则信息,根据界面提示配置参数,参考下表配置。配置完成后,单击“创建”,完成告警规则的创建。 参数 参数说明 取值样例 名称 系统会随机产生一个名称,用户也可以进行修改。 alarmb6al 描述 告警规则描述(此参数非必填项)。 8. 警规则添加完成后,当监控指标触发设定的阈值时,云监控会在第一时间通过消息通知服务实时告知您云上资源异常,以免因此造成业务损失。其他详细操作可参考云监控帮助中心。
        来自:
        帮助文档
        弹性文件服务 SFS
        用户指南
        监控
        创建告警规则
      • 1
      • ...
      • 59
      • 60
      • 61
      • 62
      • 63
      • ...
      • 317
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      弹性伸缩服务 AS

      弹性高性能计算 E-HPC

      天翼云CTyunOS系统

      模型推理服务

      科研助手

      一站式智算服务平台

      推荐文档

      关机

      退款规则及退款流程

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号