活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      云监控服务_相关内容
      • ALM-16003 Background线程使用率超过阈值
        本章节主要介绍ALM16003 Background线程使用率超过阈值的告警。 告警解释 系统每30秒周期性检测Background线程使用率情况,默认阈值为90%。如果Hive使用的background线程池使用率超过阈值,则发出告警。 说明 MRS 3.X支持Hive多实例,若集群启用了多实例功能且安装了多个Hive服务,请根据“定位信息”的“服务名”值来确定具体产生告警的Hive服务。例如Hive1服务不可用,则“定位信息”中显示服务名Hive1,处理步骤中的操作对象也应由Hive调整为Hive1。 告警属性 告警ID 告警级别 是否自动清除 16003 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 后台Background线程数过多,导致新提交的任务无法及时运行。 可能原因 Hive后台的background线程池使用率过大。 HiveServer后台的background线程池执行的任务过多。 HiveServer后台的background线程池的容量过小。 处理步骤 检查HiveServer background线程池执行任务数量 1.在FusionInsight Manager首页,选择“集群 > 待操作集群的名称 > 服务 > Hive > 具体的HiveServer实例 ”,找到“Background线程数”与“Background线程使用率”监控信息。 2.在Background线程数监控中,线程数目最近半小时时间内是否有异常偏高(默认队列数值为100,偏高数值>90)。 是,执行步骤3。 否,执行步骤5。 3.调整提交到background线程池的任务数(比如,取消一些后台性能低,耗时长的任务)。 4.“Background线程数”和“Background线程数使用率”是否下降。 是,执行步骤7。 否,执行步骤5。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-16003 Background线程使用率超过阈值
      • 查看历史告警
        本文带您了解如何查看告警历史。 操作场景 告警历史可以展示近30天所有告警规则的状态变化,帮助您统一、方便地回溯和查看告警记录。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下“告警记录”,点击“历史告警”页签,进入“历史告警”界面。 说明 界面默认展示近4小时的告警历史。您可以选择页面上方的时间范围按钮,查看“近1小时”、“近4小时”、“近6小时”、“近12小时”、“近1天”、“近3天”、“近7天”和“近1个月”的历史告警记录;您也可以在右上角的日历中选择查看近1个月内任意时间段的告警历史。
        来自:
        帮助文档
        云监控服务
        快速入门
        查看历史告警
      • 删除告警联系组
        本文为您介绍删除告警联系组的操作场景、前提条件和操作步骤。 操作场景 当告警联系组不需要使用时,您可以在控制台进行删除。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警联系组的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警联系人/组”,进入告警联系人管理页面。 5. 进入“告警联系组”页面,单击联系组所在行“操作”列的“删除”,在弹出的“删除联系组”界面,单击“确定”,可以删除告警联系组。 6. 或在“告警联系人/组”界面,可勾选多个联系组,单击“删除”,在弹出的“删除联系组”界面,单击“确定”,可以删除多个联系组。
        来自:
        帮助文档
        云监控服务
        用户指南
        联系人管理
        删除告警联系组
      • 无法远程登录Linux云主机怎么办
        本文介绍无法远程登录Linux云主机怎么办 无法远程登录Linux云主机可以使用以下方式进行问题排查: 1. 检查资源状态是否正常 请在控制台检查云服务器资源状态是否为“运行中”。如果云服务器状态为“关机”,请先开机再登录云服务器。 2. 检查登录凭证 请检查您在创建ECS时设置的登录凭证。 密码:请确认使用的登录密码是否准确,如果忘记密码可以通过重置密码功能重新设置云服务器登录密码。重置密码后请确保已重启云服务器使新密码生效。 创建后设置:如果创建时未设置登录凭证,云服务器创建成功后请单击“操作”列下的“重置密码”,根据界面提示,为弹性云服务器设置密码,请确保已重启云服务器使新密码生效。 3. 检查云主机负载是否过高 云主机的带宽和CPU利用率过高可能会导致无法登录。您可以通过云监控服务创建告警任务,当CPU或带宽利用率高时,系统会自动发送告警给您。 如果是CPU占用过高导致的无法登录请参考以下操作降低CPU使用率: 关掉一些暂时不使用的进程。 重启云主机。 变更云主机规格以升级vCPU、内存。 检查是否是带宽超限导致的无法登录,可尝试进行扩大带宽操作,扩大带宽的操作请参考弹性IP修改带宽。 完成上述操作后,再次重试远程连接云主机。 4. 检查安全组配置是否正确 在云主机的详情页面选择“安全组”页签,查看安全组入方向规则中已添加22端口。 如果没有,添加入方向的22端口,具体操作参见虚拟私有云添加安全组规则。 完成上述操作后,再次重试远程连接云主机。 5. 其他解决方案 通过上述排查后,仍然不能连接Linux实例,请您保存自助诊断结果,通过提交工单联系天翼云的技术支持寻求帮助。
        来自:
        帮助文档
        弹性云主机 ECS
        常见问题
        登录与连接
        远程连接类
        无法远程登录Linux云主机怎么办
      • 修改资源分组
        本文为您介绍创建资源分组的操作场景、前提条件和操作步骤。 操作场景 当您的资源分组需要修改名称及描述时,可以在控制台进行修改。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成云资源的创建。 您已完成资源分组的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“资源分组”,进入“资源分组”列表页。 5. 在目标资源分组的“操作”列,单击“修改”,进入修改资源分组页面。 6. 在“修改资源分组”页面修改该资源组的名称及描述。 7. 单击“确认”按钮。
        来自:
        帮助文档
        云监控服务
        用户指南
        资源分组
        修改资源分组
      • 如何使用翼MR
        本章节主要介绍翼MapReduce基本使用流程。 天翼云大数据平台 翼MapReduce是一个在云上部署和管理Hadoop系统的服务,一键即可开通部署Hadoop、HBase、Hive、Spark、Flink、Doris等大数据集群。翼MapReduce提供租户完全可控的企业级大数据集群云服务,轻松运行Hadoop、HBase、Hive、Spark、Flink、Doris等大数据组件。 翼MapReduce使用简单,通过使用在集群中连接在一起的多台计算机,您可以运行各种任务,处理或者存储(PB级)巨量数据。翼MapReduce的基本使用流程如下: 1. 创建集群:进入天翼云官网翼MapReduce服务订购页面,选择需要的业务场景,创建集群。用户可以通过业务场景简化大数据集群组合,可以用于数据湖、数据服务、云搜索、数据分析等业务需要。选择完业务场景与服务后,用户可以进一步指定集群的操作系统、主机类型、CPU类型、实例规格、实例数量、数据盘类型(普通IO、高IO、超高IO与通用型SSD多款类型)等。 2. 管理集群:上述集群购买部署完成后,翼MapReduce为用户提供企业级的大数据集群的统一管理平台翼MR Manager,帮助用户快速掌握集群服务及主机的健康状态,通过图形化的指标监控及时获取系统的关键信息,根据实际业务的性能需求修改服务属性的配置,对集群、服务、角色实例等实现一键启停等操作。 3. 创建翼MapReduce操作用户:主用户可以使用统一身份认证服务(Identity and Access Management,简称IAM)来创建子用户,通过精细的权限管理,在翼MR控制台给子用户赋予不同的角色权限。 4. 退订:如果您不想继续使用已有集群,可以通过天翼云官网的订单管理页面,对集群进行退订操作。 5. 续订:如果您的集群即将到期,可以通过续订操作延长集群使用期限。 6. 配置升级:当master、core或者core节点ECS实例的规格(vCPU和内存)无法满足您的业务需求时,您可以使用配置升级功能提升ECS实例规格。 7. 节点扩容:当master、core或task节点组内的资源无法满足您的业务需求时,您可以使用节点扩容功能增加ECS实例数量。 8. 节点缩容:当task节点组内的资源超出您的业务需求时,您可以使用节点缩容功能减少实例数量。 9. 新增节点组:当存量core或task节点组的计算或存储资源无法满足您的业务需求时,您可以使用新增节点组功能增加ECS实例。 10. 磁盘扩容:当master、core或task节点的数据存储空间无法满足您的业务需求时,您可以使用磁盘扩容功能增加云硬盘数据盘的空间。
        来自:
        帮助文档
        翼MapReduce
        快速入门
        如何使用翼MR
      • Jetcd监控
        本文主要介绍Jetcd监控 绍APM采集的Jetcd监控指标的类别、名称、含义等信息。 表Jetcd监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 是否解析Value radio JAVA false 2.2.8 是否解析键值对的值(否则将以“?”替代)。 表 Jetcd监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: 异常(exception,Jetcd调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常(exception,Jetcd调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常(exception,Jetcd调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常(exception,Jetcd调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常(exception,Jetcd调用的异常信息统计。) stackTrace 异常堆栈 该异常产生的堆栈信息 CLOB LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) endpoints 集群地址 Etcd集群地址 ENUM LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) request 请求类型 Etcd Api请求类型 ENUM LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) concurrentMax 最大并发 最大并发 INT MAX Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) errorCount 错误次数 错误次数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) invokeCount 调用次数 调用次数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) lastError 错误信息 错误信息 STRING LAST Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) maxTime 最大响应时间 最大响应时间 INT MAX Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) totalTime 总响应时间 总响应时间 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range5 110s 响应时间在110s范围请求数 INT SUM Jetcd UnaryRpc调用监控(naryRpc,Jetcd UnaryRpc调用监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) listener listener WatchImpl对应的listener类名 ENUM LAST Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) concurrentMax 最大并发 最大并发 INT MAX Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) errorCount 错误次数 错误次数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) invokeCount 调用次数 调用次数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) lastError 错误信息 错误信息 STRING LAST Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) maxTime 最大响应时间 最大响应时间 INT MAX Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) totalTime 总响应时间 总响应时间 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range5 110s 响应时间在110s范围请求数 INT SUM Jetcd Watch回调监控(watcher,Jetcd Watch回调监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) observers observers KeepAlive对应的StreamObserver类名 ENUM LAST Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) concurrentMax 最大并发 最大并发 INT MAX Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) errorCount 错误次数 错误次数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) invokeCount 调用次数 调用次数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) lastError 错误信息 错误信息 STRING LAST Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) maxTime 最大响应时间 最大响应时间 INT MAX Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) totalTime 总响应时间 总响应时间 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range1 010ms 响应时间在010ms范围请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range5 110s 响应时间在110s范围请求数 INT SUM Jetcd KeepAlive回调监控( KeepAlive,Jetcd KeepAlive回调监控) range6 10s以上 响应时间在10s以上请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) listener listener observe调用所绑定的listener的类名 ENUM LAST Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) concurrentMax 最大并发 最大并发 INT MAX Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) errorCount 错误次数 错误次数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) invokeCount 调用次数 调用次数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) lastError 错误信息 错误信息 STRING LAST Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) maxTime 最大响应时间 最大响应时间 INT MAX Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) totalTime 总响应时间 总响应时间 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range5 110s 响应时间在110s范围请求数 INT SUM Jetcd Election Observe回调监控(electionObserve,Jetcd Election Observe回调监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM Jetcd汇总(total,Jetcd汇总。) errorCount 总错误数 总错误数 INT SUM Jetcd汇总(total,Jetcd汇总。) invokeCount 调用次数 总的调用次数 INT SUM Jetcd汇总(total,Jetcd汇总。) totalTime 总响应时间 总响应时间 INT SUM Jetcd版本(version,Jetcd版本。) version 版本 版本 STRING LAST
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        数据库
        Jetcd监控
      • 云容器ETCD集群节点故障(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到Etcd节点故障 动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录云容器引擎控制台,进入 Etcd 节点监控页面,查看 Etcd 集群健康状态、数据同步延迟等指标。 2、业务应用验证: 尝试执行 Pod 创建、删除、扩缩容及集群配置修改等操作,验证是否因 Etcd 节点宕机导致操作失败或超时。 观察已运行的业务 Pod 是否保持稳定(未触发异常重建),验证故障恢复后,集群管控操作及数据同步是否能正常恢复。
        来自:
      • 采集状态
        通过采集状态页面您可以查看主机的采集状态。 1. 登录管理控制台。 2. 单击左侧,选择“管理与部署 > 应用性能管理 APM”,进入APM服务页面。 3. 在左侧导航栏选择“应用监控 >指标”,进入应用指标页。 4. 在界面左侧树单击对应环境后的,进入实例监控页面。 5. 单击“采集状态”,查看主机的采集状态列表。 表 采集状态说明 参数名称 说明 主机名称 主机名称。 IP 实例的IP地址。 实例名称 实例名称。 采集器 采集器名称。 单击“采集器”列的,支持按照采集器名称过滤。 状态 采集状态,包括:正常、采集错误以及未开始。 单击“状态”列的,支持按照状态过滤。 最后采集时间 采集器最后采集数据的时间。
        来自:
        帮助文档
        应用性能管理
        用户指南
        应用指标监控
        采集状态
      • 产品定义
        Kafka是一个拥有高吞吐、可持久化、可水平扩展,支持流式数据处理等多种特性的分布式消息流处理中间件,采用分布式消息发布与订阅机制,在日志收集、流式数据传输、在线/离线系统分析、实时监控等领域有广泛的应用。 分布式消息服务Kafka是一款基于开源社区版Kafka提供的消息队列服务,向用户提供计算、存储和带宽资源独占式的Kafka专享实例。使用分布式消息服务Kafka,资源按需申请,按需配置Topic的分区与副本数量,即买即用,您将有更多精力专注于业务快速开发,不用考虑部署和运维。
        来自:
        帮助文档
        专属云分布式消息服务Kafka
        产品简介
        产品定义
      • HBlock用户手册和安装包
        版本 发布日期 说明 4.0 2026年03月24日 1. 支持免费版本。 2. 新增调整HBlock服务占用服务器内存参数功能。 3. 上云卷新增挂起卷功能。 4. 支持通过API设置本地卷的扩展属性。 5. 增加设置鉴权方式。 3.10 2025年09月25日 1. 支持target访问权限,实现客户端和target端权限管理。 2. 支持备份,基于快照生成独立于源卷的数据备份文件。 3. 支持设置QoS规则,从带宽和IOPS维度管控流量。 3.9 2025年04月21日 1. 支持快照功能,实现数据的快速备份与恢复。 2. 支持克隆卷功能,用于数据复制、测试验证等场景。 3.8 2025年02月14日 1. API签名方法变更,提升安全性。 2. 存储卷和缓存卷支持将数据上传至兼容 S3 的对象存储。 3. 支持设置基础服务的数据存储目录。 4. Target增加回收策略,支持无卷关联后自动删除。 5. 针对智算、虚拟化以及高可用敏感度等场景,支持一键调整系统参数。 6. 支持设置折叠副本数,允许数据副本/分片放在同一个故障域中。 3.7 2024年08月08日 1. 支持设置集群拓扑。 2. 支持创建和管理多存储池。 3. 支持机房和机架级别故障域。 4. 支持设置卷的高速缓存池。 5. 支持基础服务迁移。 3.6 2024年06月03日 1. 支持存储卷和缓存卷,将数据从后端上传到天翼云对象存储(经典版)I型。 2. 硬件及HBlock监控数据支持对接到Prometheus。 3. 支持HBlock告警信息对接到智能运维平台。 4. 优化读写性能。 5. 增加对龙芯服务器的支持。 3.5 2024年03月04日 1. 支持服务器、数据目录级别的故障域,支持磁盘级别的数据服务。 2. 支持指定基础服务的安装节点。 3. 支持数据目录配额,设置HBlock可写入的数据量上限。 4. Target可被多个客户端发现并连接。 5. 设置卷的最小写入副本数,提高数据写入安全性。 6. 扩大纠删码EC N+M支持范围,满足N+M<128。 3.4 2023年07月12日 1. 卷连接支持一主多备,提高业务可用性。 2. 支持IPv6环境。 3. 控制台提供Dashboard一页式概览。 4. 支持通过命令行查询CHAP密码。 3.3 2022年12月23日 支持安全移除服务器。 3.2 2022年09月26日 1. 监控项增加,扩大覆盖范围。 2. 增加对告警、日志管理的支持。 3. 事件中增加对系统事件的支持。 3.1 2022年06月14日 1. 单机版支持添加多个数据目录。 2. 集群版支持创建Target时指定对应的服务器,支持Target迁移。 3. 支持用户事件的记录和查询。 3.0 2022年01月18日 1. 命令行变更为非交互式。 2. 支持WEB、API调用方式。 3. 卷操作:支持设置卷的高可用类型和卷的写策略。 2.1 2021年08月27日 1. 增加对ARM服务器的支持。 2. 软件许可证:查看许可证时,可以显示允许的容量。 3. 卷操作:支持对卷进行主备切换,即卷对应的Active Target和Standby Target切换。 2.0 2021年05月28日 1. 支持集群版部署。 2. 支持多副本和纠删码数据冗余。
        来自:
        帮助文档
        存储资源盘活系统
        文档下载
        HBlock用户手册和安装包
      • 通过EvalScope测试推理性能的操作指南
        3.1 关键指标解读 Throughput(吞吐量):单位时间内成功处理的请求数(req/s),反映服务负载能力,越高表明性能越优。 Latency(延迟): Mean Latency:平均响应时间,关注是否随并发升高而显著增加。 P95/P99 Latency:高百分位延迟,衡量服务稳定性(如P95表示95%请求的响应时间低于该值)。 Error Rate(错误率):超时、服务异常等失败请求占比,理想值为0%,超过1%需排查问题。 四、注意事项 1. 测试耗时 :全量测试包含多组并发和Token组合,耗时可能长达数小时,建议通过 nohup或任务调度工具执行。 2. 资源监控 :同步使用 nmon、htop等工具监控服务器CPU、内存、网络带宽,排除硬件瓶颈对测试结果的干扰。 3. API兼容性 :确保 api参数与模型服务协议一致(当前支持OpenAI格式),请求体结构需符合对应API规范。 4. 输入Token修正 :datasetinputlength设置值需比实际输入Token数少1(工具自动添加起始Token),例如预期输入1024 Token时,该参数应设为1023。 五、附录 工具文档 :EvalScope详细使用说明见官方文档。 日志示例:各测试场景的输出日志包含完整请求响应数据,可通过文本分析工具(如Grep、Excel)进行多维度对比。 本指南适用于大模型服务性能评估,旨在为技术人员提供标准化测试流程。实际操作中请根据具体环境调整参数,并结合业务负载特征设计测试用例。
        来自:
        帮助文档
        物理机 DPS
        最佳实践
        通过EvalScope测试推理性能的操作指南
      • 停止服务器上的HBlock
        参数 描述 scope SCOPE &<1 n > 停止的HBlock服务范围。一次可以指定多个服务,以英文逗号隔开。 取值: All:停止服务器上的所有服务。 Min:仅停止服务器上的ms和ps服务。 mdm:元数据管理服务(仅集群版支持)。 fc:故障转移控制服务(仅集群版支持)。 ls:日志服务(仅集群版支持)。 ds:数据服务(仅集群版支持)。 dsx:磁盘的数据服务(仅集群版支持)。 cs:协调服务(仅集群版支持)。 ms:管理服务。 ws:监控服务。 ps:协议解析服务。 ag:数据采集服务。 ua:升级监听服务。 默认值为Min。 说明 各服务具体作用详见 f 或 force 强制停止当前服务器上的HBlock服务。 注意 当停止服务器上的HBlock失败时,可以强制停止HBlock服务,但可能会造成数据丢失。
        来自:
        帮助文档
        存储资源盘活系统
        命令行参考
        停止服务器上的HBlock
      • 安装ICAgent并使用
        本章节主要介绍安装ICAgent并使用 本节以在ECS控制台购买一台ECS为例,演示如何为其安装ICAgent并在AOM界面对其进行监控。 注意事项 已开通一台ECS,且ECS的操作系统满足AOM支持的操作系统及版本。 在我的凭证中,提前获取用户AK/SK。 确认本地浏览器时间和ECS时间一致。 操作步骤 步骤 1 登录AOM控制台,左侧功能导航区域选择“配置管理 > Agent管理”。 步骤 2 进入Agent管理页面,在右侧下拉框选择目标主机的集群或“其它:用户自定义接入主机”。 步骤 3 单击“安装ICAgent”,输入我的凭证中AK/SK后,生成ICAgent安装命令,然后单击“复制命令”进行复制,如下图所示。 步骤 4 登录ECS控制台,在“弹性云主机 步骤 5 在ECS桌面单击“复制粘贴”,使用快捷键“Ctrl+V”将2中已复制的ICAgent安装命令粘贴至窗口中并单击“发送”,将复制的ICAgent安装命令发送至命令行窗口,然后在命令行窗口输入回车,执行ICAgent安装命令。 当显示“ICAgent install success”时,ICAgent已安装在了/opt/oss/servicemgr/目录。稍等片刻后,返回“Agent管理”界面查看ECS的ICAgent状态是否为“运行”。 如果ICAgent状态为“运行”,则表示ICAgent安装成功。 如果ICAgent状态为“离线”或其他状态,则请单击状态后的“详情”查看ICAgent安装失败的原因,可能是输入的AK/SK错误或ECS委托设置错误等原因导致,请获取正确的AK/SK或正确设置ECS委托后重新安装。如果还未安装成功,则请提交工单处理。 步骤 6 在AOM界面监控ECS。 ICAgent安装成功后等待1~2分钟左右,您在左侧导航栏中选择“总览 > 监控概览”,即可在“监控概览”界面对ECS进行监控,如下图所示。
        来自:
        帮助文档
        应用运维管理
        快速入门
        安装ICAgent并使用
      • 重启服务器上的HBlock
        参数 描述 scope SCOPE &<1 n > 重启的HBlock服务范围。一次可以指定多个服务,以英文逗号隔开。 取值: All:重启服务器上的所有服务。 Min:仅重启服务器上的ms和ps服务。 mdm:元数据管理服务(仅集群版支持)。 fc:故障转移控制服务(仅集群版支持)。 ls:日志服务(仅集群版支持)。 ds:数据服务(仅集群版支持)。 dsx:磁盘的数据服务(仅集群版支持)。 cs:协调服务(仅集群版支持)。 ms:管理服务。 ws:监控服务。 ps:协议解析服务。 ag:数据采集服务。 ua:升级监听服务。 默认值为Min。 说明 各服务具体作用详见 f 或 force 强制重启当前服务器上的HBlock服务。 注意 强制重启HBlock服务,可能会造成数据丢失。
        来自:
        帮助文档
        存储资源盘活系统
        命令行参考
        重启服务器上的HBlock
      • 监控项说明
        本页介绍了文档数据库服务监控信息说明。 监控指标 说明 默认监控周期 默认监控频率 CPU 实例的CPU使用率,包括: sys(CPU运行于核心态时的使用率) 、usr(CPU运行于用户态时的使用率)。 1小时 1分钟 内存 实例的内存利用率,包括: 机器内存利用率 、数据库具体的内存使用情况。 1小时 1分钟 磁盘 实例相关的磁盘性能指标,包括:磁盘利用率、Iops:每秒读写操作数、每秒读写流量(kb) 、磁盘平均队列长度。 1小时 1分钟 连接 实例连接相关的指标,包括:连接数、连接数使用率。 1小时 1分钟 TPSQPS 数据库的读写相关性能指标,包括: 指令command操作数 、查询query操作数 、插入insert操作数 、删除delete操作数 、更新update操作数 、getmore操作数。 1小时 1分钟 请求 数据库的请求相关指标,包括:活跃写请求(Active Write)、活跃读请求(Active Read)、排队写请求(Queue Write)、排队读请求(Queue Read)。 1小时 1分钟 网络 实例的网络请求数量、流量。 1小时 1分钟 全局锁 实例当前等待全局锁的队列长度,包括:全局读锁的等待队列长度、全局写锁的等待队列长度、所有全局锁的等待队列长度。 1小时 1分钟 游标 实例当前使用的cursor数,包括:当前cursor打开数量、cursor超时数量。 1小时 1分钟 缺页错误数 进程每秒页面错误率。 1小时 1分钟 断言 包括:每秒平均增加的常规断言率 、每秒平均警告率 、每秒平均消息率 、每秒平均用户断言率。 1小时 1分钟 wiredtiger 存储引擎相关指标,包括: wiredtiger内存数据量 、wiredtiger内存脏数据量 、wiredtiger磁盘读入内存量 、wiredtiger内存写入磁盘量、Cache使用百分比、Cache脏数据百分比。 1小时 1分钟 oplog(副本集独有) 包括:主节点oplog可用时间 、主节点oplog生成速率 、主备oplog重叠时长 、主备延时。 1小时 1分钟
        来自:
        帮助文档
        文档数据库服务
        用户指南
        监控管理
        监控项说明
      • 主机安全防护最佳实践
        开启定时扫描病毒 定时查杀是用来配置服务器定时启动病毒查杀的功能,按照用户设置的检测周期执行扫描任务。 1. 登录服务器安全卫士(原生版)控制台。 2. 在左侧导航栏,选择“文件安全 > 病毒查杀”,进入病毒查杀页面。 3. 单击定时扫描右侧的“设置”,页面右侧弹出病毒查杀设置窗口。 4. 打开定时扫描设置开关,配置相关参数。 参数说明如下: 参数 说明 检测模式 可选择快速检测、全盘检测、自定义检测。 检查周期 可选择每天、每3天或每7天检查周期。 生效范围 自定义选择需要执行病毒扫描任务的服务器。 5. 单击“确认”,设置完成。 设置文件完整性保护检测规则 1. 登录服务器安全卫士(原生版)控制台。 2. 在左侧导航栏,选择“文件安全 > 文件完整性保护”,进入文件完整性保护页面。 3. 单击列表右上方的“检测设置”,进入检测设置页面。 4. 配置相关参数。 参数 说明 启用文件变更检测 开启或关闭文件变更检测功能。 关键文件监控 系统内置:对系统关键文件、文件路径、文件目录进行实时监控,发现文件变更篡改行为进行告警。 自定义:根据用户特定的防护场景,自定义添加监控路径,发现文件变更篡改行为进行告警。 监控排除设置 对用户添加的信任文件路径不再进行监控,方便用户更加灵活创建检测策略。 设置生效范围 自定义选择需要执行文件变更篡改行为监控的服务器。 5. 配置完成后,单击“确认提交”。
        来自:
        帮助文档
        服务器安全卫士(原生版)
        最佳实践
        主机安全防护最佳实践
      • 修改告警联系人
        本文为您介绍修改告警联系人的操作场景、前提条件和操作步骤。 操作场景 告警联系人的联系方式发生变化时,需要及时去控制台修改告警联系人的联系方式。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 您已完成告警联系人的创建。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警联系人/组”,进入告警联系人管理页面。 5. 您可以通过以下两个路径修改告警联系人: 方式一:在“告警联系人”界面,单击待修改联系人所在行的“修改”按钮。 方式二:在“告警联系组”界面,展开待修改联系人所在的告警联系组,单击联系人所在行的“修改”按钮。 6. 修改后,单击“确定”按钮。
        来自:
        帮助文档
        云监控服务
        用户指南
        联系人管理
        修改告警联系人
      • 创建告警联系人
        本文为您介绍创建告警联系人的操作场景、前提条件和操作步骤。 操作场景 告警联系人能够接收告警通知,方便您快速处理告警问题。 前提条件 注册天翼云账号,并完成实名认证。具体操作,请参见天翼云账号注册流程。 操作步骤 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“管理与部署”,单击“云监控”,进入监控概览页面。 4. 单击“告警服务”下拉菜单,单击“告警联系人/组”,进入告警联系人管理页面。 5. 单击“添加联系人”按钮,根据弹框页面提示输入联系人的姓名、手机号、邮箱。 6. 单击“确认”按钮,完成告警联系人的创建。 7. 所创建的告警联系人的邮箱及手机号,默认处于等待激活状态。需要根据短信及邮箱相应激活码进行激活。激活后,可以在告警联系人列表页看到相应信息已经激活。 说明 未被激活的手机号码或邮箱,将无法接收到告警通知信息。
        来自:
        帮助文档
        云监控服务
        用户指南
        联系人管理
        创建告警联系人
      • Cassandra监控
        指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 Cql调用监控(Cql,Cql调用监控。) cql cql 执行的cql语句 ENUM LAST Cql调用监控(Cql,Cql调用监控。) concurrentMax 最大并发 最大并发 INT MAX Cql调用监控(Cql,Cql调用监控。) errorCount 错误次数 错误次数 INT SUM Cql调用监控(Cql,Cql调用监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Cql调用监控(Cql,Cql调用监控。) invokeCount 调用次数 调用次数 INT SUM Cql调用监控(Cql,Cql调用监控。) lastError 错误信息 错误信息 STRING LAST Cql调用监控(Cql,Cql调用监控。) maxTime maxTime 最大响应时间 INT MAX Cql调用监控(Cql,Cql调用监控。) queryRowCount 读取行数 读取行数 INT SUM Cql调用监控(Cql,Cql调用监控。) runningCount 正在执行数 该方法在采集时间点正在执行数量 INT SUM Cql调用监控(Cql,Cql调用监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Cql调用监控(Cql,Cql调用监控。) totalTime totalTime 总响应时间 INT SUM Cql调用监控(Cql,Cql调用监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Cql调用监控(Cql,Cql调用监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Cql调用监控(Cql,Cql调用监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Cql调用监控(Cql,Cql调用监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Cql调用监控(Cql,Cql调用监控。) range5 110s 响应时间在110s范围请求数 INT SUM Cql调用监控(Cql,Cql调用监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) node 节点地址 节点地址 ENUM LAST Cassandra节点调用监控(node,Cassandra节点调用监控。) concurrentMax 最大并发 最大并发 INT MAX Cassandra节点调用监控(node,Cassandra节点调用监控。) errorCount 错误次数 错误次数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Cassandra节点调用监控(node,Cassandra节点调用监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Cassandra节点调用监控(node,Cassandra节点调用监控。) invokeCount 调用次数 调用次数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) lastError 错误信息 错误信息 STRING LAST Cassandra节点调用监控(node,Cassandra节点调用监控。) maxTime maxTime 最大响应时间 INT MAX Cassandra节点调用监控(node,Cassandra节点调用监控。) totalTime totalTime 总响应时间 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range5 110s 响应时间在110s范围请求数 INT SUM Cassandra节点调用监控(node,Cassandra节点调用监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) nodes 集群节点 集群节点信息 ENUM LAST Cassandra集群调用监控(cluster,Cassandra集群调用监控。) concurrentMax 最大并发 最大并发 INT MAX Cassandra集群调用监控(cluster,Cassandra集群调用监控。) errorCount 错误次数 错误次数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) errorTraceId 错误traceId 采集周期内发生错误的调用链对应的traceid STRING LAST Cassandra集群调用监控(cluster,Cassandra集群调用监控。) slowTraceId 慢traceId 采集周期内最慢的调用链对应的traceid STRING LAST Cassandra集群调用监控(cluster,Cassandra集群调用监控。) invokeCount 调用次数 调用次数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) lastError 错误信息 错误信息 STRING LAST Cassandra集群调用监控(cluster,Cassandra集群调用监控。) maxTime maxTime 最大响应时间 INT MAX Cassandra集群调用监控(cluster,Cassandra集群调用监控。) totalTime totalTime 总响应时间 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range1 010ms 响应时间在010ms范围请求数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range2 10100ms 响应时间在10100ms范围请求数。 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range5 110s 响应时间在110s范围请求数 INT SUM Cassandra集群调用监控(cluster,Cassandra集群调用监控。) range6 10s以上 响应时间在10s以上请求数 INT SUM 获取连接详情(connection,获取连接详情。) host 所连接的host 所连接的host ENUM LAST 获取连接详情(connection,获取连接详情。) concurrentMax 最大并发 最大并发 INT MAX 获取连接详情(connection,获取连接详情。) invokeCount 调用次数 调用次数 INT SUM 获取连接详情(connection,获取连接详情。) totalTime 总时间 总时间 INT SUM 获取连接详情(connection,获取连接详情。) errorCount 错误次数 错误次数 INT SUM 获取连接详情(connection,获取连接详情。) maxTime 最慢调用 最慢调用 INT SUM 获取连接详情(connection,获取连接详情。) range1 010ms 响应时间在010ms范围请求数 INT SUM 获取连接详情(connection,获取连接详情。) range2 10100ms 响应时间在10100ms范围请求数 INT SUM 获取连接详情(connection,获取连接详情。) range3 100500ms 响应时间在100500ms范围请求数 INT SUM 获取连接详情(connection,获取连接详情。) range4 5001000ms 响应时间在5001000ms范围请求数 INT SUM 获取连接详情(connection,获取连接详情。) range5 110s 响应时间在110s范围请求数 INT SUM 获取连接详情(connection,获取连接详情。) range6 10s以上 响应时间在10s以上请求数 INT SUM 异常(exception ,Cassandra调用的异常信息统计。) exceptionType 异常类型 异常类型 ENUM LAST 异常(exception ,Cassandra调用的异常信息统计。) causeType 异常类 发生异常的类 ENUM LAST 异常(exception ,Cassandra调用的异常信息统计。) count 次数 该异常的发生次数 INT SUM 异常(exception ,Cassandra调用的异常信息统计。) message 异常消息 该异常产生的异常消息 STRING LAST 异常(exception ,Cassandra调用的异常信息统计。) stackTrace stackTrace 该异常产生的堆栈信息 CLOB LAST Cassandra汇总(total,Cassandra调用的汇总信息统计。) invokeCount 调用次数 总的调用次数 INT SUM Cassandra汇总(total,Cassandra调用的汇总信息统计。) queryRowCount 总读取行数 总读取行数 INT SUM Cassandra汇总(total,Cassandra调用的汇总信息统计。) errorCount 总错误数 总错误数 INT SUM Cassandra汇总(total,Cassandra调用的汇总信息统计。) totalTime 总响应时间 总响应时间 INT SUM Cassandra版本(version,Cassandra版本。) version 版本 版本 STRING LAST
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        数据库
        Cassandra监控
      • 到期与欠费
        本文主要介绍DRDS服务到期与欠费说明。 服务到期 “包年/包月”实例到期后无法在DRDS管理控制台进行该实例的操作,相关接口也无法调用,自动化监控或告警等运维也会停止。如果在保留期结束时您没有续费,实例将终止服务,系统中的数据也将被永久删除。 “按需计费”实例没有服务到期的概念。 欠费 “包年/包月”实例,没有欠费的概念。 “按需计费”实例是按每小时扣费,当余额不足,无法支付上一个小时的费用时,实例会冻结。您续费后,已冻结的实例会解冻,可继续正常使用。
        来自:
        帮助文档
        分布式关系型数据库
        计费说明
        到期与欠费
      • 1.6 版本特性
        本节主要介绍 1.6 版本特性 控制面组件合一,简化控制面安装和运维 社区正式版本Virtual Service Delegation更新(API和1.3先发版本完全相同) Workload Entry方便对非Kubernetes负载进行定义和管理 SDS默认启用 支持基于数据面,通过Telemetry V2的非Mixer方式的监控数据采集 支持控制面托管和非托管形态 支持多端口服务基于端口粒度的服务治理 详细内容请参阅:<
        来自:
        帮助文档
        应用服务网格
        用户指南
        网格配置
        升级
        1.6 版本特性
      • 微服务日常运维
        本节主要介绍微服务日常运维 业务场景 ServiceStage支持针对微服务应用的监控、事件、告警、日志等能力,可帮助用户实现轻松运维。 在实际的使用场景中,用户可以通过图形化指标数据和阈值告警等能力,实时监控应用运行情况,同时结合性能监控与日志策略,快速定位应用的运行问题,分析性能瓶颈等。 操作步骤 1、登录ServiceStage控制台,选择“应用管理 > 应用列表”。 2、单击创建应用时创建的应用名称(例如weathermap),进入应用“概览”页。 3、在“环境视图”页签,“环境”选择创建环境时创建的环境(例如testenv),查看已经部署的应用组件。 4、选择应用组件(以weathermapweb为例),并单击其名称进入组件“概览”页面。 在组件概览页面,可通过左侧导航菜单以及信息页面的右上角相关功能菜单/按钮进行微服务的启停、监控、查看事件与日志、应用扩缩容等日常运维操作。
        来自:
        帮助文档
        微服务引擎
        最佳实践
        使用ServiceStage托管微服务应用
        微服务日常运维
      • 告警历史
        本章节主要介绍翼MR Manager的告警历史特性。 进入到翼MR Manager以后,点击菜单“监控与告警 > 告警历史”,进入告警历史页面。如图所示: 页面上方为查询区域,各种查询条件进行组合查询。 支持查询集群服务级、角色实例级、主机级的告警信息。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        翼MR Manager操作指导
        监控与告警
        告警历史
      • 开始监控JAVA应用
        为部署在CCE容器中的JAVA应用安装Agent 前提条件 部署APM Agent时,必须确保接入APM的机器与APM服务网络连通,Agent才能正常工作。 可使用Telnet命令测试目标机器与APM服务器网络是否连通。 访问域名(Endpoint)列表,获取所在region的endpoint。 选择“系统管理 > 访问密钥”进入访问密钥页面,查看获取接入javaagent所需的AK/SK。 图 获取AK/SK 使用说明 目前只支持部署CCE的JAVA应用。相关参数说明参见下表。 表 性能管理配置参数列表 参数名称 参数说明 安装探针 选择安装探针。目前只支持“APM探针”。 探针类型 选择探针的版本类型。 探针升级策略 探针升级的方式、策略。默认为“重启自动升级”。 重启自动升级:每次都尝试重新下载镜像。 重启手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。 APM环境 输入APM环境名称,该参数为选填。 APM业务 选择一个已有的APM应用。 子业务 输入APM子应用,该参数为选填。 接入密钥 将会自动获取APM服务的密钥信息。 操作步骤 步骤 1 登录CCE管理控制台,在左侧导航栏中选择“工作负载 > 无状态负载 Deployment”或“工作负载 > 有状态负载 StatefulSet”,单击“创建无状态工作负载”或“创建有状态工作负载”。 步骤 2 在创建工作负载时,在“高级设置”中找到“性能管理配置”,在“安装探针”处勾选“APM探针”,将会启用应用性能管理服务并在节点上安装探针。 说明 安装探针会产生少量资源消耗,主要作用是可对java工作负载提供应用调用链、拓扑、SQL分析、堆栈追踪等监控能力。 步骤 3 填写探针相关参数。 监控组:输入监控组名称,如testapp。若已有监控组,可下拉选择。 探针版本:选择探针的版本。 “探针升级策略”,默认为“重启自动升级”。 重启自动升级:每次都尝试重新下载镜像。 手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。 步骤 4 应用启动后,等待约3分钟,应用数据就会呈现在APM界面中,此时登录APM,您可以在APM上通过拓扑、调用链等进行应用性能优化。 为CodeArts Deploy应用安装Agent
        来自:
        帮助文档
        应用性能管理
        快速入门
        开始监控JAVA应用
      • 事件通知概述
        本章节主要介绍数据仓库服务事件通知概述。 支持的事件类别和事件 事件是用户集群状态发生变化的记录。它可以是由用户操作触发的(比如审计事件),也有可能是集群服务状态变化引起的(比如集群修复成功或集群修复失败)。以下为当前DWS 支持的事件和事件类别列表。 下表显示了事件源类型为集群的事件 事件类别 事件名称 事件级别 事件 管理 createClusterFail 警告 集群创建失败 管理 createClusterSuccess 正常 集群创建成功 管理 createCluster 正常 开始创建集群 管理 extendCluster 正常 开始扩容集群 管理 extendClusterSuccess 正常 集群扩容成功 管理 extendClusterFail 警告 集群扩容失败 管理 deleteClusterFail 警告 集群删除失败 管理 deleteClusterSuccess 正常 集群删除成功 管理 deleteCluster 正常 开始删除集群 管理 restoreClusterFail 警告 集群恢复失败 管理 restoreClusterSuccess 正常 集群恢复成功 管理 restoreCluster 正常 开始恢复集群 管理 restartClusterFail 警告 集群重启失败 管理 restartClusterSuccess 正常 集群重启成功 管理 restartCluster 正常 开始重启集群 管理 configureMRSExtDataSources 正常 开始配置集群的MRS外部数据源 管理 configureMRSExtDataSourcesFail 警告 配置集群的MRS外部数据源失败 管理 configureMRSExtDataSourcesSuccess 正常 配置集群的MRS外部数据源成功 管理 deleteMRSExtDataSources 正常 开始删除集群MRS外部数据源 管理 deleteMRSExtDataSourcesFail 警告 删除集群MRS外部数据源失败 管理 deletedMRSExtDataSourcesSuccess 正常 删除集群MRS外部数据源成功 管理 bindEipToCluster 正常 集群绑定EIP 管理 bindEipToClusterFail 警告 集群绑定EIP失败 管理 unbindEipToCluster 正常 集群解绑EIP 管理 unbindEipToClusterFail 警告 集群解绑EIP失败 管理 refreshEipToCluster 正常 集群刷新EIP 管理 refreshEipToClusterFail 警告 集群刷新EIP失败 安全 resetPasswordFail 警告 集群密码重置失败 安全 resetPasswordSuccess 正常 集群密码重置成功 安全 updateConfiguration 正常 开始更新集群安全参数 安全 updateConfigurationFail 警告 更新集群安全参数失败 安全 updateConfigurationSuccess 正常 更新集群安全参数成功 监控 repairCluster 正常 节点故障,开始修复集群 监控 repairClusterFail 警告 集群修复失败 监控 repairClusterSuccess 正常 集群修复成功 下表显示了事件源类型为快照的事件 事件类别 事件名称 事件级别 事件 管理 deleteBackup 正常 快照删除成功 管理 deleteBackupFail 警告 快照删除失败 管理 createBackup 正常 开始创建快照 管理 createBackupSuccess 正常 快照创建成功 管理 createBackupFail 警告 快照创建失败
        来自:
        帮助文档
        数据仓库服务
        用户指南
        监控与告警
        事件通知
        事件通知概述
      • 应用场景
        本文介绍全站加速产品的应用场景。 政府机构 针对因新政策发布造成的访问突增,通过多级缓存、智能路由、链路优化等技术,缓解源站压力。 IPv6协议支持,满足国家政策要求。 全链路安全传输方案,保障页面内容安全不被篡改。 全方位链路监控、源站监控,以及724小时专属技术支持,保障业务可靠性。 金融行业 适用于银行、保险、证券等对数据安全要求较高的行业。 全链路支持HTTPS、HTTP2.0协议,满足传输安全及性能提升需求。 基于自研的动态智能路由及多级缓存技术,保障全站内容快速交付。 电子商务 适用于网上购物平台、电子票务、网上支付等电子商务场景;通过多级缓存、智能路由等技术,有效缩短页面加载时间,提升浏览、搜索、下单、支付等操作的流畅性。 有序回源、全网带宽控制,缓解电商活动访问突增给源站带来的带宽及并发压力。 提供用户区域分布报表,帮助电商开展有针对性的促销活动。 娱乐资讯 适用于社交论坛、生活服务、新媒体等娱乐资讯场景;通过智能分离动静态内容,动态内容智能选择优质链路回源,提升注册、登录、聊天、搜索、发帖等交互信息即时性。 全球优质资源覆盖,提升各区域各运营商用户的访问速度和成功率,提升SEO排名。 提供源站负载均衡、源站全方位监控和离线服务模式,保障源站业务不中断。
        来自:
        帮助文档
        全站加速
        产品介绍
        应用场景
      • 监控面板:视图查询
        接口功能介绍 返回给定监控视图的所有监控项内容,包括监控视图名称和具体的监控项内容。 一个监控视图包含一个或多个监控项,监控项为keyvalue格式。 接口约束 regionID(资源池)、templateID(监控面板)、viewID(监控视图)存在。 URI GET /v4/monitor/describemonitorview 请求参数 Query参数 参数 参数类型 是否必填 示例 说明 下级对象 regionID String 是 81f7728662dd11ec810800155d307d5b 资源池ID templateID String 是 466d5eb4484311eda9b7005056897257 监控面板ID viewID String 是 4cb790ae489411edb386005056897257 监控视图ID 响应参数 参数 参数类型 说明 示例 下级对象 statusCode Integer 返回状态码(800为成功,900为失败),默认值:800 800 errorCode String 失败时的错误代码,参见公共错误码说明 message String 失败时的错误描述,一般为英文描述 Success msgDesc String 失败时的错误描述,一般为中文描述 成功 returnObj Object 返回对象 returnObj 表returnObj 参数 参数类型 说明 示例 下级对象 viewID String 监控项所属视图ID 4cb790ae489411edb386005056897257 viewTitle String 监控项所属视图名称 viewPutTest itemContent Object 查询到的监控项具体内容,为keyvalue格式 itemContent 表itemContent 参数 参数类型 说明 示例 下级对象 {itemName} String 监控项名称 tcKey11 {value} Object 监控项值,与监控项名称组成keyvalue格式,可以为任意内容 tcVal11
        来自:
        帮助文档
        云监控服务
        API参考
        API
        监控服务
        监控面板
        监控面板:视图查询
      • 通过GPUStack部署模型推理平台
        什么是 GPUStack ? GPUStack云服务是基于开源GPUStack构建的托管式AI模型部署平台,让您无需管理基础设施,即可在高性能GPU集群上轻松部署和运行各类AI模型。 GPUStack具备以下核心能力: 资源管理:提供自动化GPU资源调度与集群管理,支持异构GPU设备统一纳管,实现资源利用率最大化与成本最优化; 模型部署:支持主流开源大模型一键部署,兼容Hugging Face、ModelScope等模型源,集成vLLM、SGLang和TensorRTLLM等高性能推理引擎,满足不同场景性能需求; 智能运维:内置自动扩缩容、故障转移与负载均衡机制,提供实时性能监控与告警,确保服务高可用性与稳定性; 安全管控:提供完善的认证授权体系与网络隔离策略,支持私有化部署与数据安全保障,满足企业级安全合规要求。 通过部署 GPUStack 应用,您可以可视化管理GPU资源调度,快速搭建专属模型推理集群,为AI应用提供专属模型推理服务。 使用 GPUStack 部署模型推理平台指南 步骤1:订购GPU资源并部署GPUStack平台 1. 登录天翼云官网,选择应用商城 公有云生态专区,点击立即选购,进入应用专区页。 在专区页,点击“立即选购”,进入应用选购页。 2. 在应用选购列表中,找到“GPUStack单机版”,点击“立即订购”。 3. 按提示订购“GPUstack 单机版”,点击“确认下单”。 支付成功后,在我的应用页,查看应用状态,当应用状态为运行中时,代表GPUStack平台部署完成。 4. 点击“查看应用”按钮,在应用详情页点击“立即使用”或在浏览器中输入复制的应用入口,即可访问GPUstack。
        来自:
        帮助文档
        轻量型云主机
        最佳实践
        通过GPUStack部署模型推理平台
      • 为什么云搜索服务中的索引写入速度突然下降?
        原因分析 1. 写入冲突:当多个客户端同时向同一个索引写入数据时,可能会发生写入冲突,导致部分写入操作被推迟或重试,从而降低写入速度。 2. 磁盘 I/O 限制:写入操作需要频繁访问磁盘。如果磁盘 I/O 性能不佳或资源被其他任务占用,写入速度会受到影响。 3. 缓冲区溢出:云搜索服务在写入数据时会使用内存缓冲区。如果缓冲区满了,系统会强制刷新到磁盘,这个过程可能会拖慢写入速度。 4. 垃圾回收(GC)问题:如果节点的 JVM 频繁进行垃圾回收,特别是 Full GC,系统性能会受到影响,导致写入速度下降。 解决方案 1. 优化写入并发:避免高并发写入到同一索引,可以通过拆分索引或批量写入方式减少冲突。调整客户端的并发写入线程数和批量写入大小。 2. 提升磁盘性能:使用更高性能的磁盘设备(如 SSD),确保磁盘 I/O 不是瓶颈。检查系统中是否有其他进程占用了磁盘资源,影响了写入速度。 3. 调整刷新间隔:可以通过增加刷新间隔来减少缓冲区强制刷新到磁盘的频率,如下述命令将延长刷新时间,允许更多的数据在内存中积累,从而减少写入延迟。 PUT INDEXNAME/settings { "index.refreshinterval": "30s" } 4. 优化垃圾回收设置:监控 JVM 的垃圾回收行为,必要时升级到 G1 GC 或调整堆内存大小,减少 GC 对性能的影响。
        来自:
        帮助文档
        云搜索服务
        常见问题
        问题排查类
        云搜索实例使用类
        为什么云搜索服务中的索引写入速度突然下降?
      • RabbitMqProducer
        介绍APM监控详情里消息监控中的RabbitMqProducer相关指标的名称、含义等信息。 RabbitMqProducer监控指标说明表 指标类别 指标 指标说明 数据类型 异常 exceptionstacktrace 异常产生的堆栈信息 String 异常 exceptioncount 错误数 Int Exchange监控 messagedestination Exchange名 Enum Exchange监控 messageerrorcount 推送消息的错误次数 Int Exchange监控 messagecount 推送消息数 Int Exchange监控 messagetotalpayload 推送字节数 Int Exchange监控 Max(messagetotalpayload) 单次推送最大字节数 Int Exchange监控 messagemaxcost 推送消息的最大响应时间 Int Exchange监控 sum(messagecost) 推送消息的总响应时间 Int Total监控 messagetotalpayload 推送字节数 Int Total监控 messagecount 推送消息数 Int Total监控 messageerrorcount 推送消息的错误次数 Int Total监控 messagemaxcost 推送消息的最大响应时间 Int Total监控 sum(messagecost) 推送消息的总响应时间 Int Total监控 ms0To10Count 010ms次数 Int Total监控 ms10To100Count 10100ms次数 Int Total监控 ms100To500Count 100500ms次数 Int Total监控 ms500To1000Count 5001000ms次数 Int Total监控 ms1000To10000Count 110s次数 Int Total监控 msMorethan10000Count 10s以上次数 Int
        来自:
        帮助文档
        应用性能监控 APM
        产品介绍
        指标总览
        消息监控
        RabbitMqProducer
      • 基本指标监控有哪些?
        本文介绍分布式缓存服务Redis版基本指标监控 基本指标监控目前主要包含:支持实例QPS,缓存命中率,内存碎片率,内存使用率,客户端连接数、每秒新建连接数、历史淘汰key总数、每秒淘汰key总数、历史逐出key总数、每秒逐出key总数、已设置过期时间的key总数等监控指标。 指标名称 单位 说明 每秒并发操作数(QPS) Counts/s 每秒总请求数,包含读和写命令。 缓存命中率 % 命中率计算方法:Key命中数÷(Key命中数+Key未命中数)。 内存碎片率 % memfragmentationratio (内存碎片率) usedmemoryrss (操作系统实际分配给 Redis 的物理内存空间大小)/ usedmemory(Redis 内存分配器为了存储数据实际申请使用的内存空间大小) memfragmentationratio (内存碎片率)的值越大代表内存碎片率越严重。 客户端连接数 个 Redis实例客户端连接数量 键总数 个 Redis实例的key总数 阻塞客户端连接数 个 Redis实例当前被阻塞操作挂起的客户端的数量 已使用内存 G Redis实例内存的已使用量 每秒新建连接数 个 Redis实例每秒新建客户端连接的个数 历史淘汰key总数 个 Redis实例记录的历史淘汰key总数 每秒淘汰key总数 个 Redis实例每秒淘汰的key数量 历史逐出key总数 个 Redis实例历史总逐出key的数量 每秒逐出key总数 个 Redis实例每秒逐出的key数量 已设置过期时间的key总数 个 Redis实例当前存在过期key的数量
        来自:
        帮助文档
        分布式缓存服务Redis版
        常见问题
        功能类
        基本指标监控有哪些?
      • 1
      • ...
      • 52
      • 53
      • 54
      • 55
      • 56
      • ...
      • 636
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      GPU云主机

      训推服务

      AI Store

      公共算力服务

      应用托管

      一站式智算服务平台

      推荐文档

      基本概念

      页面顶部

      共享协作

      云间高速的优势

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号