活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 聚力AI赋能 天翼云大模型专项 大模型特惠专区·Token Plan 轻享包低至9.9元起
  • 青云志云端助力计划 NEW 一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云
  • 企业出海解决方案 NEW 助力您的业务扬帆出海,通达全球!
  • 天翼云信创专区 NEW “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
Token服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V4-Flash
  • GLM-5.1
  • Qwen3.5-122B-A10B
  • DeepSeek-V3.2(旗舰版)
  • GLM-5(正式版)
智算一体机
  • 智算一体机
智能体引擎
  • 智能体引擎
智算安全专区
  • 大模型安全评测
  • 大模型安全护栏
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2026智能云生态大会
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      云监控服务_相关内容
      • 监控面板:视图监控项创建
        接口功能介绍 为监控视图新增监控项,原有监控项保留。 如果新增监控项与原有监控项key相同,则以新增监控项值为准。 一个监控视图包含一个或多个监控项,监控项为keyvalue格式。 接口约束 regionID(资源池)、templateID(监控面板)、viewID(监控视图)存在。 URI POST /v4/monitor/createmonitoritem 请求参数 请求体body参数 参数 参数类型 是否必填 示例 说明 下级对象 regionID String 是 81f7728662dd11ec810800155d307d5b 资源池ID templateID String 是 466d5eb4484311eda9b7005056897257 监控面板ID viewID String 是 f750ec8a487c11eda9b7005056897257 监控视图ID itemContent Object 是 要添加的监控项内容,为keyvalue格式 itemContent 表itemContent 参数 参数类型 是否必填 示例 说明 下级对象 {itemName} String 是 tcKey11 监控项名称 {value} Object 是 tcVal11 监控项值,与监控项名称组成keyvalue格式,可以为任意内容 响应参数 参数 参数类型 说明 示例 下级对象 statusCode Integer 返回状态码(800为成功,900为失败),默认值:800 800 errorCode String 失败时的错误代码,参见公共错误码说明 message String 失败时的错误描述,一般为英文描述 Success msgDesc String 失败时的错误描述,一般为中文描述 成功 returnObj Object 返回对象 returnObj 表returnObj 参数 参数类型 说明 示例 下级对象 success Boolean 是否创建成功 true
        来自:
        帮助文档
        云监控服务
        API参考
        API
        监控服务
        监控面板
        监控面板:视图监控项创建
      • ALM-12005 OKerberos资源异常
        本章节主要介绍 ALM12005 OKerberos资源异常 。 告警解释 告警模块对Manager中的Kerberos资源的状态按80秒周期进行监控,当连续6次监控到Kerberos资源异常时,系统产生此告警。 当Kerberos资源恢复时,且告警处理完成时,告警恢复。 告警属性 告警ID 告警级别 是否自动清除 12005 重要 是 告警参数 参数名称 参数含义 来源 产生告警的集群或系统名称。 服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 对系统的影响 Manager中的Kerberos资源异常,组件WebUI认证服务不可用,无法对Web上层服务提供安全认证功能,可能引起无法登录FusionInsight Manager和组件的WebUI。 可能原因 Okerberos依赖的OLdap资源异常。 处理步骤 检查Manager中的OKerberos依赖的OLdap资源是否异常 1.以omm用户登录到集群中Manager所在节点主机。 通过登录FusionInsight Manager浮动IP节点,执行sh ${BIGDATAHOME}/omserver/om/sbin/statusoms.sh脚本来查看当前Manager的双机信息。 2.执行 sh ${BIGDATAHOME}/omserver/OMS/workspace0/ha/module/hacom/script/statusha.sh ,查询当前HA管理的OLdap资源状态是否正常(单机模式下面,OLdap资源为Activenormal状态;双机模式下,OLdap资源在主节点为Activenormal状态,在备节点为Standbynormal状态。)。 是,执行步骤4。 否,执行步骤3。 3.参考ALM12004OLdap资源异常的处理步骤进行处理,OLdap资源状态恢复后,观察当前OKerberos资源状态是否恢复正常。 是,操作结束。 否,执行步骤4。
        来自:
        帮助文档
        翼MapReduce
        用户指南
        FusionInsight Manager操作指导(适用于3.x)
        告警参考(适用于MRS 3.x版本)
        ALM-12005 OKerberos资源异常
      • 查看告警信息
        本章节介绍如何查看数据库安全审计的告警信息,以及当处理告警后如何确认告警。 前提条件 已成功购买数据库安全审计实例,且实例的状态为“运行中”。 已成功添加数据库并开启审计功能。 已成功添加并安装Agent。 已设置告警通知。 操作步骤 1. 登录管理控制台。 2. 单击右上角的 ,选择区域。 3. 选择“安全 > 数据库安全服务”,进入数据库安全审计“总览”界面。 4. 在左侧导航树中,选择“实例列表”,进入“实例列表”界面。 5. 单击需要查看告警信息的实例名称,选择“监控 > 告警监控”,进入告警监控页面。 6. 查看告警信息,相关参数说明如下表所示。 参数名称 说明 发生时间 告警发生的时间。 告警类型 告警的类型,包括:风险规则告警 CPU异常 内存异常 磁盘异常 审计容量不足 告警风险等级 告警的风险等级,包括: 高风险 中风险 低风险 恢复时间 恢复告警的时间。 确认状态 告警的确认状态。单击,可以筛选“未确认”或“已确认”状态的告警信息。 描述 告警的相关描述信息。 您可以按照以下方法,查询指定的告警信息。 选择“时间”(“全部”、“近30分钟”、“近1小时”、“近24小时”、“近7天”或“近30天”),或单击 ,选择开始时间和结束时间,单击“确认”,列表显示该时间段的告警信息。 选择“风险等级”(“全部”、“高”、“中”或“低”),列表显示该级别的告警信息。 选择“告警类型”,列表显示该类型的告警信息。
        来自:
        帮助文档
        数据库安全
        用户指南
        查看监控信息
        查看告警信息
      • 删除监控任务
        本节介绍如何删除监控任务。 情况一:监控任务正常 点击监控任务列表中待删除监控任务行后的“删除”图标,系统弹出确认删除提示框后,点击“确认”即可。 情况二:监控任务不可用 为保证探测结果准确,监控结果为“不可用”的监控任务只允许查看任务详情和处置措施,不允许删除监控任务。可通过修改监控任务所关联的解析记录触发平台自动删除监控任务。
        来自:
        帮助文档
        云解析
        用户指南
        域名监控管理
        监控任务管理
        删除监控任务
      • 监控面板:视图监控项删除
        接口功能介绍 删除监控视图中的指定监控项。 一个监控视图包含一个或多个监控项,监控项内容为keyvalue格式。 不能删除该视图下的所有监控项,必须保证有实际的监控项内容,否则请使用监控视图删除。 接口约束 regionID(资源池)、templateID(监控面板)、viewID(监控视图)、itemKeys(监控项Key)存在。 URI POST /v4/monitor/deletemonitoritem 请求参数 请求体body参数 参数 参数类型 是否必填 示例 说明 下级对象 regionID String 是 81f7728662dd11ec810800155d307d5b 资源池ID templateID String 是 466d5eb4484311eda9b7005056897257 监控面板ID viewID String 是 4cb790ae489411edb386005056897257 监控视图ID itemKeys Array of String 是 ["tcKey1"] 要删除的监控项内容Key 响应参数 参数 参数类型 说明 示例 下级对象 statusCode Integer 返回状态码(800为成功,900为失败),默认值:800 800 errorCode String 失败时的错误代码,参见公共错误码说明 message String 失败时的错误描述,一般为英文描述 Success msgDesc String 失败时的错误描述,一般为中文描述 成功 returnObj Object 返回对象 returnObj 表returnObj 参数 参数类型 说明 示例 下级对象 deleteCount Integer 删除成功的监控项数目 1
        来自:
        帮助文档
        云监控服务
        API参考
        API
        监控服务
        监控面板
        监控面板:视图监控项删除
      • kafkaConsumer
        介绍APM监控详情里消息监控中的KafkaConsumer相关指标的名称、含义等信息。 KafkaConsumer监控指标说明表 指标类别 指标 指标说明 数据类型 主题 (Topic,Kafka的Topic监控数据) id Clientid和IP信息 Enum 主题 (Topic,Kafka的Topic监控数据) topic Kafka的Topic名称 Enum 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerbytesconsumedrate 每秒消费字节 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerfetchsizeavg 请求获取平均字节 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerfetchsizemax 请求获取最大字节 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerrecordsconsumedrate 每秒消费消息数 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerrecordsperrequestavg 单次请求平均消息数 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerrecordsconsumedrate 总消费次数 Int 主题 (Topic,Kafka的Topic监控数据) kafkaconsumerrecordsperrequestavg 总消费字节数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) errorCount 错误数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) invokeCount 调用次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) maxTime 最慢调用 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) ms0To10Count 010ms次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) ms10To100Count 10100ms次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) ms100To500Count 100500ms次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) ms500To1000Count 5001000ms次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) ms1000To10000Count 110s次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) msMorethan10000Count 10s以上次数 Int Kafka消费方法监控 (Consumer,Kafka消费方法监控) totalTime 总响应时间 Int 汇总(Total,KafkaConsumer汇总信息统计) recordConsumedTotal 总消费次数 Int 汇总(Total,KafkaConsumer汇总信息统计) bytesConsumedTotal 总消费字节数 Int 异常 (Exception,Kafka消费异常信息) exceptionstacktrace 异常产生的堆栈信息 String 异常 (Exception,Kafka消费异常信息) exceptiontype 异常类型 String 异常 (Exception,Kafka消费异常信息) exceptioncount 错误数 Int
        来自:
        帮助文档
        应用性能监控 APM
        产品介绍
        指标总览
        消息监控
        kafkaConsumer
      • 相关术语解释
        Endpoint Endpoint 表示OOS对外服务的访问域名。OOS以HTTP RESTful API的形式对外提供服务,当访问不同地域的时候,需要不同的域名。具体地域详见域名(Endpoint)列表。 地域( Region ) 地域表示 OOS的数据中心所在物理位置。 访问密钥( AccessKey ) AccessKeyID和SecretAccessKey是您访问OOS的密钥,OOS会通过它来验证您的资源请求,请妥善保管。您可以在OOS控制台访问控制安全凭证密钥页面中查看AccessKeyId。 访问控制( IAM ) IAM是OOS提供的访问控制服务,使您能够更加安全的管理对OOS服务和资源的访问。 操作跟踪( CloudTrail ) CloudTrail是OOS提供的账户活动跟踪服务,可以持续监控并记录账户中OOS服务中相关的活动。
        来自:
        帮助文档
        对象存储(经典版)I型
        快速入门
        相关术语解释
      • 通知记录:查询
        请求示例 请求url /v4/monitor/querymessagerecords 请求头header 无 请求体body 无 响应示例 json { "statusCode": 800, "returnObj": { "MessageRecords": [ { "recordID": "653226259d6c887fdafa8c61", "receiver": "test@chinatelecom.cn", "recordType": 0, "method": "email", "recordStatus": 0, "subject": "【一键报警】cpu使用率告警通知规则ID(6520c2528d4ae066080a34f0)", "content": "[完成处理]尊敬的天翼云用户,云监控告警提醒:告警状态已恢复"正常"n告警名称:【一键报警】cpu使用率n监控指标:cpuutil 【CPU使用率】n告警描述:无描述n资源池名称:内蒙azn监控对象:【监控对象:ALL】n首次触发时间:20231008 10:12:00nnsystem 完成处理n问题 5 分钟无更新,系统自动关闭n", "errMessage": "", "createTime": 1697785381111 } ], "totalCount": 1, "currentCount": 1, "totalPage": 1 }, "errorCode": "", "message": "Success", "msgDesc":"成功" } 状态码 状态码 描述 200 请求成功 错误码 errorCode 描述 其他 参见公共错误码说明
        来自:
        帮助文档
        云监控服务
        API参考
        API(新)
        告警服务
        通知记录
        通知记录:查询
      • 相关术语解释
        事件 事件告诉您AOM自身或ECS、ServiceStage、CCE等外部服务发生了某种变化,但不一定会引起业务异常,事件一般用来表达一些重要信息。您不用对事件进行处理。 阈值规则 阈值规则指对资源的监控指标设置阈值条件,当指标数据满足阈值条件时,会产生阈值告警(阈值告警即由阈值规则触发而产生的告警);当没有指标数据上报时,会产生数据不足事件(数据不足事件即由阈值规则触发而产生的事件)。 日志 AOM提供了海量运行日志的检索和分析功能,支持日志采集、下载、转储、搜索,并提供报表分析、SQL查询、实时监控、关键词告警等能力。 统计规则 周期性地统计关键词或SQL语句,并生成指标数据,以便您实时了解系统性能及业务等信息。同时,还可以针对日志指标添加阈值规则,当满足阈值条件时产生阈值告警,以便您能在第一时间发现异常并进行处理。
        来自:
        帮助文档
        应用运维管理
        产品简介
        相关术语解释
      • 应用回退
        本文介绍如何应用回退。 用户可以停止运行中的应用,重新运行之前版本的应用。回退操作可以通过应用管理界面列表操作【回退】进入回退页面,也可以通过点击具体的应用进入详情页点击【回退】页签进入监控页面。 操作步骤 1.登录云容器引擎控制台,单击左侧导航栏的【工作负载】>【无状态】或【有状态】,进入应用管理列表; 2.点击应用,进入应用详情页面,点击选项页【回退】,进入回退页面; 3.查看应用版本列表,点击【回退到该版本】,等待应用重新创建。
        来自:
        帮助文档
        云容器引擎(旧版)
        用户指南
        应用资源
        应用管理运维
        应用回退
      • 连接和查看Kafka Manager
        本文主要介绍 连接和查看Kafka Manager。 Kafka Manager是开源的Kafka集群管理工具,需要通过浏览器才能访问Kafka Manager的地址。在Kafka Manager页面,您可以查看Kafka集群的监控、代理等信息。 前提条件 已配置如下表所示安全组。 表安全组规则 方向 协议 端口 源地址 说明 入方向 TCP 9999 0.0.0.0/0 访问Kafka Manager。 登录Kafka Manager 步骤 1 (可选)创建一台与Kafka实例相同VPC和相同安全组的Windows服务器,详细步骤请参考《弹性云主机用户指南》的“创建弹性主机”章节。 如果是已经开启了公网访问,该步骤为可选,在本地浏览器中即可访问,不需要单独的Windows弹性云主机。 步骤 2 在实例详情信息页面,获取Kafka Manager地址。 未开启公网访问时,Kafka Manager地址为“Manager内网访问地址”。 图 Kafka Manager内网访问地址 已开启公网访问时,Kafka Manager地址为“Manager公网访问地址”。 图 Kafka Manager公网访问地址 步骤 3 在浏览器中输入Kafka Manager的地址,进入Kafka Manager登录页面。 如果是开启了公网访问,在本地浏览器输入Kafka Manager地址访问;如果没有开启公网访问,需要登录步骤1的弹性云主机,然后在浏览器输入Kafka Manager地址访问。 步骤 4 输入创建实例时设置的Kafka Manager用户名和密码,即可管理Kafka集群。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        连接Kafka实例
        连接和查看Kafka Manager
      • 编辑监测任务
        该任务指导用户通过漏洞扫描服务编辑资产的监测任务。 操作场景 该任务指导用户通过漏洞扫描服务编辑资产的监测任务。 前提条件 已获取管理控制台的登录帐号与密码。 已创建监测任务。 操作步骤 1. 登录管理控制台。 2. 在左侧导航树中,单击,选择“安全 > 漏洞扫描(专业版)”。 3. 在左侧导航树中,选择“安全监测”,进入“安全监测”界面。 4. 在目标监测任务所在行的“操作”列中,单击“编辑任务”。 5. 根据需求,重新配置监控信息和扫描项设置。
        来自:
        帮助文档
        漏洞扫描(专业版)
        用户指南
        安全监测
        编辑监测任务
      • KafkaConsumer监控
        本文主要介绍KafkaConsumer监控 介绍APM采集的KafkaConsumer监控指标的类别、名称、含义等信息。 表 KafkaConsumer监控采集参数 参数名 数据类型 应用类型 默认值 Agent支持的起始版本 Agent支持的终止版本 描述 kafka慢请求阈值 integer JAVA 800 2.1.14 超过慢请求阈值的方法提高采样率。 kafka消费方法配置 objarray JAVA 2.1.14 kafka消费方法配置。 表 KafkaConsumer监控指标说明 指标类别 指标 指标名称 指标说明 单位 数据类型 默认聚合方式 ::::::: 主题 (topic,kafka的topic监控数据。) id id clientid和ip信息 ENUM LAST 主题 (topic,kafka的topic监控数据。) topic topic kafka的topic名称 ENUM LAST 主题 (topic,kafka的topic监控数据。) bytesConsumedRate 每秒消费字节 每秒消费字节 Byte INT AVG 主题 (topic,kafka的topic监控数据。) fetchSizeAvg 请求获取平均字节 请求获取平均字节 Byte INT AVG 主题 (topic,kafka的topic监控数据。) fetchSizeMax 请求获取最大字节 请求获取最大字节 Byte INT MAX 主题 (topic,kafka的topic监控数据。) recordsConsumedRate 每秒消费消息数 每秒消费消息数 INT AVG 主题 (topic,kafka的topic监控数据。) recordsPerRequestAvg 单次请求平均消息数 单次请求平均消息数 INT AVG 主题 (topic,kafka的topic监控数据。) seqIds Producer生成序列号 Producer生成序列号 STRING LAST 主题 (topic,kafka的topic监控数据。) recordConsumedTotal 总消费次数 总消费次数 INT SUM 主题 (topic,kafka的topic监控数据。) bytesConsumedTotal 总消费字节数 总消费字节数 INT SUM fetch (fetch,kafka的fetch监控数据) id id clientid和ip信息 ENUM LAST fetch (fetch,kafka的fetch监控数据) bytesConsumedRate 每秒消费字节 每秒消费字节 Byte INT AVG fetch (fetch,kafka的fetch监控数据) fetchLatencyAvg 请求平均时延 请求平均时延 ms INT AVG fetch (fetch,kafka的fetch监控数据) fetchLatencyMax 请求最大时延 请求最大时延 ms INT MAX fetch (fetch,kafka的fetch监控数据) fetchRate 每秒请求数 每秒请求数 INT AVG fetch (fetch,kafka的fetch监控数据) fetchSizeAvg 请求获取平均字节 请求获取平均字节 Byte INT AVG fetch (fetch,kafka的fetch监控数据) fetchSizeMax 请求获取最大字节 请求获取最大字节 Byte INT MAX fetch (fetch,kafka的fetch监控数据) recordsConsumedRate 每秒消费消息数 每秒消费消息数 INT AVG fetch (fetch,kafka的fetch监控数据) recordsLagMax 最大堆积消息数 最大堆积消息数 INT MAX fetch (fetch,kafka的fetch监控数据) recordsPerRequestAvg 单次请求平均消息数 单次请求平均消息数 INT AVG fetch (fetch,kafka的fetch监控数据) seqIds Producer生成序列号 Producer生成序列号 STRING LAST fetch (fetch,kafka的fetch监控数据) recordConsumedTotal 总消费次数 总消费次数 INT SUM fetch (fetch,kafka的fetch监控数据) bytesConsumedTotal 总消费字节数 总消费字节数 INT SUM partition (partition,kafka的partition监控数据。) id id clientid和ip信息 ENUM LAST partition (partition,kafka的partition监控数据。) partition partition kafka的partition名称 ENUM LAST partition (partition,kafka的partition监控数据。) recordsLag 堆积消息数 堆积消息数 INT LAST partition (partition,kafka的partition监控数据。) recordsLagAvg 平均堆积消息数 平均堆积消息数 INT AVG partition (partition,kafka的partition监控数据。) recordsLagMax 最大堆积消息数 最大堆积消息数 INT MAX partition (partition,kafka的partition监控数据。) seqIds Producer生成序列号 Producer生成序列号 STRING LAST kafka消费方法监控 (consumer,kafka消费方法监控。) method method 消费方法 ENUM LAST kafka消费方法监控 (consumer,kafka消费方法监控。) concurrentMax 最大并发 最大并发 INT MAX kafka消费方法监控 (consumer,kafka消费方法监控。) errorCount 错误数 错误数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) invokeCount 调用次数 调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) lastError 错误信息 发生错误时产生的错误信息 STRING LAST kafka消费方法监控 (consumer,kafka消费方法监控。) maxTime 最大响应时间 采集周期内最大响应时间 INT MAX kafka消费方法监控 (consumer,kafka消费方法监控。) range1 010ms 响应时间在010ms范围调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) range2 10100ms 响应时间在10100ms范围调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) range3 100500ms 响应时间在100500ms范围调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) range4 5001000ms 响应时间在5001000ms范围调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) range5 110s 响应时间在110s范围调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) range6 10s以上 响应时间在10s以上调用次数 INT SUM kafka消费方法监控 (consumer,kafka消费方法监控。) totalTime 总响应时间 总响应时间 INT SUM KafkaConsumer汇总(total,KafkaConsumer汇总信息统计。) recordConsumedTotal 总消费次数 总消费次数 INT SUM KafkaConsumer汇总(total,KafkaConsumer汇总信息统计。) bytesConsumedTotal 总消费字节数 总消费字节数 INT SUM KafkaConsumer汇总(total,KafkaConsumer汇总信息统计。) recordsLag 总堆积消息数 总堆积消息数 INT LAST 异常 (exception,kafka消费异常信息。) causeType 异常发生类 异常发生类 ENUM LAST 异常 (exception,kafka消费异常信息。) exceptionType 异常类 异常类 ENUM LAST 异常 (exception,kafka消费异常信息。) count 数量 异常数量 INT SUM 异常 (exception,kafka消费异常信息。) message 异常消息 异常消息 STRING LAST 异常 (exception,kafka消费异常信息。) stackTrace 异常堆栈 异常堆栈 CLOB LAST
        来自:
        帮助文档
        应用性能管理
        产品介绍
        指标总览
        消息队列
        KafkaConsumer监控
      • 云主机网络包损坏
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察应用,特别是那些进行大文件传输或对实时性要求高的服务,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        计算
        弹性云主机
        云主机网络包损坏
      • 云容器集群节点网络包损坏
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
        帮助文档
        应用高可用
        用户指南
        故障演练服务
        故障动作库
        云容器
        云容器引擎
        云容器集群节点网络包损坏
      • 云容器集群Pod网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云容器集群节点网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察运行在目标节点上的业务 Pod 与其他 Pod 或外部服务通信时,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云主机网络包损坏(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络包损坏动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的HTTP请求错误数、HTTP状态码统计指标。 2、业务应用验证: 观察应用,特别是那些进行大文件传输或对实时性要求高的服务,是否出现性能下降或连接中断。 检查应用日志,确认是否有因重传或超时导致的错误或警告信息。
        来自:
      • 云主机网络延迟(1)
        3、配置全局策略 1. 在全局配置 页面,按需添加保护策略 和监控指标。 2. 配置完成后,单击完成 按钮,创建演练任务。 4、发起故障注入 1. 发起演练 :在演练管理 列表找到对应演练任务,单击操作列的执行演练, 在新页面中点击发起新演练。 2. 进入实验 :系统将自动跳转到本次演练的运行详情 页,或在演练执行记录 列表点击对应执行实例的详情进入。 3. 注入故障 :在动作组 中,找到网络延迟动作卡片,单击执行。 4. 查看日志 :单击动作卡片本身,在右侧弹出的侧边栏中查看执行详情。 效果验证 在故障注入期间,您可以通过以下方式验证演练效果: 1、观测实例指标: 登录应用性能监控 控制台,观测已接入应用的应用提供服务平均响应时间指标。 2、业务应用验证: 观察应用,确认依赖网络通信的模块(如调用外部API、数据库查询)是否出现响应缓慢或请求超时。 检查应用日志,确认是否有因超时而触发的重试、熔断或降级逻辑。
        来自:
      • 权限管理
        本节介绍了云数据库TaurusDB的权限管理。 IAM权限管理 如果帐号已经能满足您的要求,不需要创建独立的IAM用户进行权限管理,您可以跳过本章节,不影响您使用TaurusDB的其他功能。 如果您需要对购买的TaurusDB资源,为企业中的员工设置不同的访问权限,为达到不同员工之间的权限隔离,您可以使用统一身份认证服务 (Identity and Access Management,简称IAM)进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制资源的访问。 通过IAM,您可以在帐号中给员工创建IAM用户,并授权控制员工对资源的访问范围。例如您的员工中有负责软件开发的人员,您希望开发人员拥有TaurusDB的使用权限,但是不希望拥有删除TaurusDB等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用TaurusDB,但是不允许删除TaurusDB的权限,控制开发人员对TaurusDB资源的使用范围。 IAM是提供权限管理的基础服务,无需付费即可使用,您只需要为您帐号中的资源进行付费。 TaurusDB权限 默认情况下,管理员创建的IAM用户没有任何权限,需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 TaurusDB部署时通过物理区域划分,为项目级服务。授权时,“作用范围”需要选择“区域级项目”,然后在指定区域对应的项目中设置相关权限,并且该权限仅对此项目生效;如果在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问TaurusDB时,需要先切换至授权区域。 策略:IAM最新提供的一种细粒度授权的能力,可以精确到具体服务的操作、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对云数据库TaurusDB,管理员能够控制IAM用户仅能对某一类数据库资源进行指定的管理操作。 如下表所示,包括了云数据库TaurusDB的所有系统权限。 表 TaurusDB系统权限 策略名称 描述 类别 GaussDB FullAccess 云数据库TaurusDB服务的所有执行权限。 系统策略 GaussDB ReadOnlyAccess 云数据库TaurusDB服务的只读访问权限。 系统策略 下表列出了云数据库TaurusDB常用操作与系统权限的授权关系,您可以参照该表选择合适的系统权限。 表 常用操作与系统权限的关系 操作 GaussDB FullAccess GaussDB ReadOnlyAccess 创建TaurusDB实例 支持 不支持 删除TaurusDB实例 支持 不支持 查询TaurusDB实例列表 支持 支持 表 常用操作与对应授权项 操作名称 授权项 备注 修改参数模板 gaussdb:param:modify 变更数据库实例的规格 gaussdb:instance:modifySpec 创建数据库实例 gaussdb:instance:create 界面选择VPC、子网、安全组需要配置:vpc:vpcs:listvpc:vpcs:getvpc:subnets:getvpc:securityGroups:get创建加密实例需要在项目上配置KMS Administrator权限。创建包周期实例需要配置CBC权限:bss:renewal:viewbss:renewal:updatebss:balance:viewbss:order:view 创建手动备份 gaussdb:backup:create 查询备份列表 gaussdb:backup:list 查询错误日志 gaussdb:log:list 重启实例 gaussdb:instance:restart 查询数据库实例列表 gaussdb:instance:list 创建参数模板 gaussdb:param:create 删除参数模板 gaussdb:param:delete 修改备份策略 gaussdb:instance:modifyBackupPolicy 查看参数模板 gaussdb:param:list 删除实例 gaussdb:instance:delete 删除手动备份 gaussdb:backup:delete 查询项目标签 gaussdb:tag:list 应用参数模板 gaussdb:param:apply 批量添加删除项目标签 gaussdb:instance:dealTag 变更配额 gaussdb:quota:modify 升级数据库实例版本 gaussdb:instance:upgrade 只读升主 gaussdb:instance:switchover 修改数据库端口 gaussdb:instance:modifyPort 修改实例安全组 gaussdb:instance:modifySecurityGroup 修改读写内网地址 gaussdb:instance:modifyIp 界面选择ip需要配置:vpc:vpcs:listvpc:vpcs:get 开启、关闭SSL gaussdb:instance:modifySSL 修改实例名称 gaussdb:instance:rename 添加只读节点 gaussdb:instance:addNodes 删除只读节点 gaussdb:instance:deleteNodes 修改存储空间 gaussdb:instance:modifyStorageSize 修改数据库实例密码 gaussdb:instance:modifyPassword 绑定公网IP gaussdb:instance:bindPublicIp 界面列出公网IP需要配置:vpc:publicIps:getvpc:publicIps:list 解绑公网IP gaussdb:instance:unbindPublicIp 修改监控策略 gaussdb:instance:modifyMonitorPolicy 修改节点倒换优先级 gaussdb:instance:modifySwitchoverPriority 修改可维护时间窗 gaussdb:instance:modifyMaintenanceWindow 节点隔离 gaussdb:instance:isolateNodes 创建数据库用户 gaussdb:user:create 删除数据库用户 gaussdb:user:delete 修改数据库用户密码 gaussdb:user:modify 查询数据库用户 gaussdb:user:list 数据库用户授权 gaussdb:user:grantPrivilege 回收数据库用户权限 gaussdb:user:revokePrivilege 创建数据库 gaussdb:database:create 删除数据库 gaussdb:database:delete 查询数据库列表 gaussdb:database:list
        来自:
        帮助文档
        云数据库TaurusDB
        产品介绍
        权限管理
      • 告警查询
        本节介绍云安全中心告警查询功能。 告警查询具体操作请参考日志查询。 告警查询 告警查询结果栏字段筛选: 图表分析
        来自:
        帮助文档
        云安全中心
        用户指南
        分析中心
        告警查询
      • 查看监控数据
        操作场景 天翼云分布式消息Kafka自集成了一整套监控方案,对Kafka实例的运行状态进行日常监控,可以通过管理控制台查看Kafka实例各项监控指标。 操作前提 已开通天翼云Kafka实例,且实例状态为“运行中” 实例有进行生产消费行为,实例中存在可消费的消息 Kafka 实例是天翼云Ⅱ类资源池实例,目前Ⅱ类资源池包括:华东1、上海36、华北2、长沙42、武汉41、西安7、杭州7、青岛20、西南1、西南2、广州4、郑州5、华南2等 操作步骤 1. 登录管理控制台。 2. 进入Kafka管理控制台。 3. 在实例列表页的操作列,目标实例行点击“管理”。 4. 点击“可观测”后,选择“监控信息”,默认展示实例监控,除此之外,监控信息还包括实例节点监控、Topic监控、消费组监控和Connect监控,Connect监控只有开启Kafka Connect才展示。
        来自:
        帮助文档
        分布式消息服务Kafka
        用户指南
        可观测
        监控信息
        查看监控数据
      • 购买短信服务
        告警短信套餐包按不同规格计费,您订购告警短信套餐包后,如果实际使用超过每月免费额度,则从订购套餐包抵扣。 套餐包选购 告警短信套餐包不同规格单价优惠有所差异,您可以按实际需要选择合理套餐包资源。套餐包整体使用期限为两年。具体价格如下表示: 计费项 规格区间(条) 单价(元/条) 价格说明 计费项 规格区间(条) 单价(元/条) 价格说明 告警短信套餐包 0<规格≤5000 0.045 如果您订购的资源包规格为1000条,则标准价格为:0.045100045元 告警短信套餐包 5000<规格≤50000 0.0432 同上 告警短信套餐包 50000<规格 0.042 同上 说明 短信告警免费额度为1000条/月,自然月到期后自动失效。 购买短信套餐包方式 1. 登录控制中心。 2. 在控制中心页面左上角点击,选择区域,本文我们选择华东1。 3. 依次选择“迁移与管理”,单击“云监控服务”,进入监控概览页面。 4. 选择“套餐管理”,进入套餐管理界面。 5. 在套餐管理界面,点击“订购短信套餐包”按钮,即可进入短信套餐包订购页面。
        来自:
        帮助文档
        云监控服务
        计费说明
        告警服务
        购买短信服务
      • 系统兼容与迁移限制
        如何处理“权限不够,请添加相应细粒度权限”? 问题描述:迁移过程中提示“SMS.0204权限不够,错误原因:xxx,请添加相应细粒度权限”。具体的错误原因与缺失的细粒度权限有关。 问题原因和解决方案: 1、 目的端账户余额不满足大于100元的条件,余额不足会导致迁移失败,请充值或申请权限,然后重新发起迁移任务。 2、 主机迁移服务在迁移过程中会用到ECS,VPC,IMS,EVS等的相关权限,缺少其中的某些权限会导致迁移失败。请检查权限并在IAM控制台创建用户组,授予“SMS FullAccess”、"OBS OperateAccess"、“ECS FullAccess”、“VPC FullAccess”权限。 “源端缺少必要的驱动文件”怎么处理? 启动Agent后,SMS控制台显示校验失败,提示“ SMS.6511 源端缺少必要的驱动文件”。启动Agent后,SMS会校验源端的驱动文件,若驱动文件不存在会报错。 校验的文件为 C:Windowssystem32DRIVERSatapi.sys C:Windowssystem32DRIVERSpciidex.sys C:Windowssystem32DRIVERSintelide.sys 请按照路径检查源端是否存在以上文件,若不存在,建议使用驱动修复工具进行修复,或者尝试从其他机器拷贝该驱动文件。 “源端的镜像服务VSS不存在”怎么处理? Windows系统启动Agent后,SMS控制台显示校验失败,提示“SMS.6533 源端的镜像服务VSS不存在”。出现该问题主要有以下两个原因: 1. 源端VSS服务不存在。 2. 源端VSS服务被禁止启动。 解决方案 1. 在任务管理器中查看VSS服务是否存在,若不存在,请执行2,若存在,请执行3。 2. 修改配置文件,不启动IO监控。如果不需要同步数据,可以通过修改配置文件,取消IO监控。修改Agent安装目录config下gproperty.cfg的enablesync为False,然后重启Agent。 3. 查看VSS服务状态,若状态为“已停止”。右键,选择“打开服务”。在Volume Shadow Copy服务上右键,选择“属性”,启动类型设置成手动。单击“确定”。 4. 在任务管理器界面,右键VSS服务,选择“开始。 5. 登录SMS控制台,单击该服务所在行的“更多 > 删除”。 6. 删除完成后,重新启动Agent,开始迁移。
        来自:
        帮助文档
        主机迁移服务SMS
        常见问题
        系统兼容与迁移限制
      • Pod水平自动扩缩(HPA)
        步骤一 安装cubeprometheus和cubemetricsadapter插件 通过预置的高阶指标(如网络、磁盘等)依赖监控cubeprometheus和cubemetricsadapter插件 登陆云容器引擎控制台,进入需要操作的集群,在左侧菜单选择 插件 > 插件市场 ,选择cubemetricsadapter插件进行安装 需要注意的是如果集群的监控插件为ccsemonitor,需要修改values中metricsProvider.mode参数为ccsemonitor 步骤二 配置HPA策略 登陆云容器引擎控制台,进入需要操作的集群,在左侧菜单选择 工作负载 并选择进入对应的工作负载页面,以下以无状态工作负载为例,点击需要伸缩的工作负载右侧的更多按钮,选择弹性伸缩,点击 + 号新增自定义指标策略 点击新增Pod规则,在指标名称中输入预置的指标名并设置伸缩的预置及副本数伸缩范围,点击确定创建HPA策略。云容器引擎提供的预置指标如下列表格所示 云容器引擎提供的预置指标 cpu预置指标 指标名称 指标对象 指标含义 指标单位 计算公式 k8spodcpucoreused Pod CPU使用量 核 sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) k8spodratecpucoreusednode Pod CPU利用率(占节点) % (labelreplace(sum(rate(containercpuusagesecondstotal{name ~ ".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod,instance,namespace), "node", "$1", "instance", "(.)")) / on(node) groupleft sum(kubenodestatusallocatable{resource"cpu"}) by (node) 100 k8spodratecpucoreusedrequest Pod CPU利用率(占request) % sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) / (sum (kubepodcontainerresourcerequests{resource"cpu",pod~"$Pod",namespace"$namespace"}) by (pod))100 k8spodratecpucoreusedlimit Pod CPU利用率(占limit) % sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) / (sum (kubepodcontainerresourcelimits{resource"cpu",pod~"$Pod",namespace"$namespace"}) by (pod))100
        来自:
        帮助文档
        云容器引擎 专有版/托管版
        最佳实践
        工作负载
        Pod水平自动扩缩(HPA)
      • Pod水平自动扩缩(HPA)(1)
        步骤一 安装cubeprometheus和cubemetricsadapter插件 通过预置的高阶指标(如网络、磁盘等)依赖监控cubeprometheus和cubemetricsadapter插件 登陆云容器引擎控制台,进入需要操作的集群,在左侧菜单选择 插件 > 插件市场 ,选择cubemetricsadapter插件进行安装 需要注意的是如果集群的监控插件为ccsemonitor,需要修改values中metricsProvider.mode参数为ccsemonitor 步骤二 配置HPA策略 登陆云容器引擎控制台,进入需要操作的集群,在左侧菜单选择 工作负载 并选择进入对应的工作负载页面,以下以无状态工作负载为例,点击需要伸缩的工作负载右侧的更多按钮,选择弹性伸缩,点击 + 号新增自定义指标策略 点击新增Pod规则,在指标名称中输入预置的指标名并设置伸缩的预置及副本数伸缩范围,点击确定创建HPA策略。云容器引擎提供的预置指标如下列表格所示 云容器引擎提供的预置指标 cpu预置指标 指标名称 指标对象 指标含义 指标单位 计算公式 k8spodcpucoreused Pod CPU使用量 核 sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) k8spodratecpucoreusednode Pod CPU利用率(占节点) % (labelreplace(sum(rate(containercpuusagesecondstotal{name ~ ".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod,instance,namespace), "node", "$1", "instance", "(.)")) / on(node) groupleft sum(kubenodestatusallocatable{resource"cpu"}) by (node) 100 k8spodratecpucoreusedrequest Pod CPU利用率(占request) % sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) / (sum (kubepodcontainerresourcerequests{resource"cpu",pod~"$Pod",namespace"$namespace"}) by (pod))100 k8spodratecpucoreusedlimit Pod CPU利用率(占limit) % sum(rate(containercpuusagesecondstotal{image~".+",pod~"$Pod",namespace"$namespace"}[5m])) by (pod) / (sum (kubepodcontainerresourcelimits{resource"cpu",pod~"$Pod",namespace"$namespace"}) by (pod))100
        来自:
      • 配置Agent
        操作场景 用户成功安装Agent插件后,需要修改相关配置文件,用于上报监控指标和心跳数据。 前提条件 已成功安装Agent插件。 操作步骤 1.使用root账号,登录物理机。 2.执行以下命令,切换至Agent安装路径的bin下。 cd /usr/local/telescope/bin 3.修改配置文件conf.json。 a.执行以下命令,打开配置文件conf.json。 vi conf.json b.修改文件中的参数,具体参数请参见下表。 { "InstanceId":"xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx", "ProjectId": "b5b92ee0xxxxxxxxxxxxxxxxcab92396", "AccessKey": "QZ0XGJXFxxxxxxxxT65R", "SecretKey": "lEv2aXAGwxxxxxxxxxxxxxxxxxxxxF8t0Bf18Tn2", "RegionId": "cnhz1" } •公共配置参数 参数 说明 InstanceId 物理机ID,可通过登录管理控制台,在物理机列表中查看。说明InstanceId可不用配置,保持"InstanceId":"",即可,若需要配置,请参考下两条。该资源ID需保证全局唯一性,即同一个RegionID下Agent使用的InstanceId不能相同,否则系统可能会出现异常。InstanceId必须与实际的物理机资源ID一致,否则云监控界面将看不到对应物理机资源操作系统监控的数据。 ProjectId ProjectId可不用配置,保持"ProjectId": "",即可。若需要配置,请参考已下获取方式。项目ID,获取方式如下: 1. 登录管理控制台,单击右上角“用户名”,选择“我的凭证”; 2. 在项目列表中,查看物理机资源对应的所属区域的项目ID。 AccessKey/SecretKey 访问密钥,获取方式如下: 登录管理控制台,单击右上角“用户名”,选择“我的凭证>管理访问秘钥”; 如已有访问密钥,查看创建时下载保存的credentials.csv文件中,获取文件中记录的Key值即可; 如未创建,则通过“新增访问密钥”可创建新的访问密钥,妥善保存credentials.csv文件,并获取文件中记录的Key值。 为了安全考虑,建议该用户为IAM用户,并且权限仅为CES Administrator和LTS Administrator。配置的AccessKey必须在“我的凭证 >管理访问秘钥”列表中,否则将鉴权失败,云监控界面看不到操作系统监控数据。 RegionId 区域ID,例如:物理机资源所属区域为“杭州”,则RegionID为“cnhz1”。 4.修改云监控指标采集模块的配置文件confces.json。 a.执行以下命令,打开公共配置文件confces.json。 vi confces.json b.修改文件中的参数,具体参数请参见下表。 { "Endpoint": " } •指标采集模块参数配置 参数 说明 Endpoint 物理机资源所属区域的云监控Endpoint URL,例如:物理机资源所属区域为“杭州”,则URL中使用“ces.cnhz1.ctyun.cn”。 说明 Agent插件配置完成后,因监控数据暂未上报,插件状态仍显示“未安装”,等待35分钟,刷新即可。
        来自:
        帮助文档
        物理机 DPS
        最佳实践
        物理机监控配置实践
        配置Agent
      • 告警列表
        本节介绍云安全中心告警管理功能。 为用户提供查询、解决建议、处置威胁等功能。 TQL条件查询 选择常用时间查询 选择时间范围(最大查询时间窗口为30天) 查询条件组 保存查询条件,方便用户查询(保存的查询条件最多为10个)。
        来自:
        帮助文档
        云安全中心
        用户指南
        威胁运营
        告警列表
      • 事件流概述
        随着越来越多的数据源持续、快速地产生数据,此类流式数据急需被系统分析和处理。事件流适用于端到端的流式数据处理场景,对源端产生的事件实时抽取、转换和分析并加载至目标端,帮助您轻松处理流式数据。 事件流总体架构 事件流作为更轻量、实时端到端的流式事件通道,提供轻量流式数据的过滤和转换的能力,在不同的数据仓库之间、数据处理程序之间、数据分析和处理系统之间进行数据同步,连接不同的系统与服务。 如下图所示,事件源与事件目标之间无需定义事件总线,事件通过事件流这个通道在源端和目标端之间进行流转。 事件源:事件的来源,可将天翼云服务如分布式消息Kafka的业务数据作为事件流中的事件提供方。 事件过滤:事件流通过事件模式过滤事件并将事件路由到事件目标,事件模式必须和匹配的事件具有相同的结构。 事件转换:可选择天翼云函数计算作为事件转换器,您可以通过编写函数代码对事件进行更复杂、更加定制化的处理。 事件目标:消费事件消息。 功能优势 实时高效 事件流支持实时从事件源获取、过滤与转换事件,并加载至事件目标。无需定义事件总线,您可以更快地访问事件。 轻量集成 只需在控制台简单创建任务或者一次调用,即可建立实时端到端的流式事件通道,避免了复杂繁琐的操作,便于快速集成。 指标监控 事件流提供多个指标,您可以使用这些指标监控数据流的运行状况,出现异常时及时运维,确保数据流正常运行。 节约成本 按量计费,按照数据量进行计费,不使用则不收费。
        来自:
        帮助文档
        事件总线
        用户指南
        事件流
        事件流概述
      • 查看策略组
        策略名称 策略说明 支持的操作系统 企业版 旗舰版 网页防篡改版 容器安全 资产发现 检测系统中的软件信息,包含软件名称、软件路径、主要应用等,帮助用户识别异常资产。 Linux × √ √ √ 弱口令检测 检测系统帐户口令是否属于常用的弱口令,针对弱口令提示用户修改。 Linux √ (只支持自定义弱口令) √ √ √ 配置检测 对常见的Tomcat配置、Nginx配置、SSH登录配置进行检查,帮助用户识别不安全的配置项。 Linux × √ √ √ containerescape 对容器到宿主机的逃逸进行检测,避免出现漏洞风险。 Linux × × × √ Webshell检测 检测云服务器上Web目录中的文件,判断是否为Webshell木马文件。 Linux √ (只支持配置检测路径) √ √ √ 容器文件监控 检测违反安全策略的文件异常访问,安全运维人员可用于判断是否有黑客入侵并篡改敏感文件。 Linux × × × √ 容器进程白名单 检测违反安全策略的进程启动。 Linux × × × √ 文件保护 检测操作系统、应用程序软件和其他组件的文件,确定文件是否发生了可能遭受攻击的更改。 Linux × √ √ √ 登录安全检测 检测SSH、FTP、MySQL等帐户遭受的口令破解攻击。 如果30秒内,帐户暴力破解次数(连续输入错误密码)达到5次及以上,HSS就会拦截该源IP,禁止其再次登录,防止主机因帐户破解被入侵。 SSH类型攻击默认拦截12小时,其他类型攻击默认拦截24小时。根据帐户暴力破解告警详情,如“攻击源IP”、“攻击类型”和“拦截次数”,您能够快速识别出该源IP是否为可信IP,如果为可信IP,您可以通过手动解除拦截的方式,解除拦截的可信IP。 Linux × √ √ √ 恶意文件检测 反弹shell:实时监控用户的进程行为,及时发现进程的非法Shell连接操作产生的反弹Shell行为。 异常shell:检测系统中异常Shell的获取行为,包括对Shell文件的修改、删除、移动、复制、硬链接、访问权限变化。 Linux × √ √ √ 进程异常行为 通过对运行进程的管控,全局检测各个主机的运行信息,保障云主机的安全性。您可以建立自己的进程白名单,对于进程的非法行为、黑客入侵过程进行告警。 Linux × √ √ √ root提权 检测当前系统文件路径的root提权行为。 Linux × √ √ √ 实时进程 检测进程中高危命令的执行行为,发生高危命令执行时,触发告警。 Linux,Windows × √ √ √
        来自:
        帮助文档
        企业主机安全
        用户指南
        安全运营
        查看策略组
      • 日志触发器
        日志触发器能够为您提供增量日志的触发事件,您可以及时感知到指定的日志单元产生了新的日志,结合日志服务提供的SDK,您可以消费到最新的增量日志,完成定制化的任务。 使用场景 监控关键日志并告警。通过配置日志触发器,您可以及时消费到增量日志,通过编排工作流,可以监听捕捉日志内容,并发出告警。 实现日志数据的ETL。通过配置日志触发器,您可以持续消费指定日志单元的日志(Extract),通过编排工作流,可以对日志数据进行清洗、脱敏等一系列处理,并投递到新的日志单元(Transform,Load)。 触发机制 事件的基本传递机制请参考概述。 增量日志事件的上报:日志单元会持续监听日志数据写入,如果没有新增日志,不会上报事件;如果有新增日志,且最近60秒内日志量少于25MB,那每60秒会上报一次;如果日志量大于25MB,则在日志量达到25MB时上报一次。 Event事件的data部分格式如下。 plaintext { "beginCursor":7256969395249872970, // 日志数据起始游标,标识增量日志的开始位置 "endCursor":7256969395249872981, // 日志数据结束游标,标识当次上报日志结束为止 "unitCode":"0fc54abd09aa8c" // 日志单元ID } 日志触发器只会推送日志事件的元数据信息,不包括日志内容,如果需要消费日志内容,请使用云日志提供的SDK并结合Event事件data字段进行日志消费,具体用法可参考文档。
        来自:
        帮助文档
        函数计算
        用户指南
        云工作流
        控制台操作
        工作流调度
        事件总线类触发器
        日志触发器
      • 性能管理配置(性能瓶颈分析)
        操作场景 当前支持给Java类工作负载提供调用链、拓扑等监控能力,若您为Java类工作负载,并且需要监控状态,请勾选“Java探针”选项,并输入监控组名称。 工作负载创建时和创建后,均可以对Java类工作负载监控进行设置。 说明: 若您还未开通应用性能管理服务,请单击界面中的,参照界面提示购买应用实例数,单击“立即购买”,查看订单无误后,参照界面提示单击“提交订单”。 操作步骤 创建工作负载时进行设置 步骤 1 登录CCE管理控制台,在左侧导航栏中选择“工作负载 > 无状态负载 Deployment”或“工作负载 > 有状态负载 StatefulSet”,单击“创建无状态工作负载”或“创建有状态工作负载”。 步骤 2 在创建工作负载时,在“高级设置”中找到“性能管理配置”,在“安装探针”处勾选“Java探针”,将会启用应用性能管理服务并在节点上安装探针。 说明:安装探针会产生少量资源消耗,主要作用是可对java工作负载提供应用调用链、拓扑、SQL分析、堆栈追踪等监控能力。 步骤 3 输入监控组名称,如testapp。若已有监控组,可下拉选择。 步骤 4 选择“探针版本”。探针版本默认为latest,具体可查看下拉框后的“版本说明”。 图设置性能管理配置 步骤 5 选择“探针升级策略”,默认为“重启自动升级”。 说明:“探针升级策略”为获取探针镜像的策略,可选值有“重启自动升级”和“手动升级”。 重启自动升级:每次都尝试重新下载镜像。 手动升级:如果本地有该镜像,则使用本地镜像,本地不存在时下载镜像。 创建工作负载后设置或修改 步骤 1 登录CCE管理控制台,在左侧导航栏中选择“工作负载 > 无状态负载 Deployment”或“工作负载 > 有状态负载 StatefulSet”。 步骤 2 在工作负载列表中,单击要设置的工作负载名称,在工作负载详情页中单击“工作负载运维”页签。 步骤 3 在“性能管理配置”中,单击下方的“编辑”,勾选“Java探针”,将会启用应用性能管理服务并在节点上安装探针。 图12 单击编辑后进行设置 说明: 安装探针会产生少量资源消耗,主要作用是可对java工作负载提供应用调用链、拓扑、SQL分析、堆栈追踪等监控能力。 步骤 4 输入或修改“监控组”名称,如testapp。若已有监控组,可下拉选择。 步骤 5 选择“探针版本”。探针版本默认为latest,具体可查看下拉框后的“版本说明”。 步骤 6 选择“探针升级策略”,默认为“重启自动升级”。 图设置或修改性能管理配置 步骤 7 单击“重启实例”,完成设置。 说明: 1.9.7以下版本的集群,在“有状态工作负载”中不能修改该设置。 步骤 8 应用启动后,等待约3分钟,应用数据就会呈现在APM界面中,此时登录APM,您可以在APM上通过拓扑、调用链等进行应用性能优化,详细操作请参考。
        来自:
        帮助文档
        云容器引擎
        用户指南
        旧版UI
        工作负载
        容器设置
        性能管理配置(性能瓶颈分析)
      • 1
      • ...
      • 57
      • 58
      • 59
      • 60
      • 61
      • ...
      • 687
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      聚力AI赋能 天翼云大模型专项

      大模型特惠专区·Token Plan 轻享包低至9.9元起

      青云志云端助力计划

      一站式科研助手,海外资源安全访问平台,助力青年翼展宏图,平步青云

      企业出海解决方案

      助力您的业务扬帆出海,通达全球!

      天翼云信创专区

      “一云多芯、一云多态”,国产化软件全面适配,国产操作系统及硬件芯片支持丰富

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      物理机 DPS

      镜像服务 IMS

      弹性高性能计算 E-HPC

      天翼云CTyunOS系统

      训推服务

      Token服务

      智算一体机

      知识库问答

      人脸实名认证

      推荐文档

      云课堂 第五课:CC攻击介绍及如何防御

      入门教程④:Windows Service 2008系统扩容卷功

      错误日志

      PostgreSQL

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 息壤智算平台
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号