云主机开年特惠28.8元/年,0元秒杀等你来抢!
查看详情

活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 安全隔离版OpenClaw NEW OpenClaw云服务器专属“龙虾“套餐低至1.5折起
  • 天翼云新春焕新季 NEW 云主机开年特惠28.8元/年,0元秒杀等你来抢!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
公共算力服务
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      视频监控_相关内容
      • 配置告警
        创建联系人组 进入分布式消息服务MQTT管理控制台,在实例列表页点击管理进入实例详情页,左侧菜单点击告警管理 点击通知组菜单,右侧点击新建联系人组,输入联系人信息信息,点击保存 创建通知策略 进入分布式消息服务MQTT管理控制台,在实例列表页点击管理进入实例详情页,左侧菜单点击告警管理 点击通知策略菜单,右侧点击创建通知策略,输入信息,点击确认 创建告警规则 进入分布式消息服务MQTT管理控制台,在实例列表页点击管理进入实例详情页,左侧菜单点击告警管理 点击告警规则菜单,右侧点击创建告警规则,选择告警指标,输入告警条件、告警内容等信息,点击保存 成为第一个赞同者
        来自:
        帮助文档
        分布式消息服务MQTT
        用户指南
        监控与告警
        配置告警
      • 文档数据库DDS支持的事件列表
        文档数据库DDS支持的事件列表 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 创建实例业务失败 DDSCreateInstanceFailed 重要 创建文档数据库实例失败产生的事件,一般是由于磁盘个数、配额不足,底层资源耗尽导致。 检查磁盘个数、配额大小是否满足需求,并考虑释放资源后重新创建实例。 无法创建数据库实例。 复制状态异常 DDSAbnormalReplicationStatus 重要 出现”复制状态异常“事件通常有两种情况: 1、主机与备机或只读实例之间复制时延太大(一般在写入大量数据或执行大事务的时候出现),在业务高峰期容易出现阻塞。 2、主机与备机或只读实例之间的网络中断,导致主机与备机或只读实例复制异常。 提交工单。 不会导致原来实例的读写中断,客户的应用是无感知的。 复制状态异常已恢复 DDSReplicationStatusRecovered 重要 复制时延已回到正常范围内,或者主备之间的网络通信恢复。 不需要处理。 无 实例运行状态异常 DDSFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 DDSDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 DDSFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 DDSDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 DDSPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 数据盘空间不足 DDSRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 DDSDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无影响。 用户计划删除KMS密钥 DDSplanDeleteKmsKey 重要 一般是由于用户计划删除kms的key导致。 计划删除kms的key后,及时恢复kms的key或者及时解密数据。 kms的key被删除后用户无法进行磁盘加密。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        文档数据库DDS支持的事件列表
      • 分布式关系型数据库DRDS支持的事件列表
        分布式关系型数据库DRDS支持的事件列表 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 创建实例失败 createDDM InstanceFailed 重要 一般是由于底层资源不足等原因导致。 释放资源后重新创建。 无法创建DRDS实例。 变更规格失败 resizeFlavor Failed 重要 一般是由于底层资源不足等原因导致。 请工单联系运维在后台协调资源再重试规格变更操作。 部分节点业务中断 节点扩容失败 enlargeNode Failed 重要 一般是由于底层资源不足等原因导致。 请工单联系运维后台协调资源,删除添加失败的节点,重新尝试添加节点 节点扩容失败 节点缩容失败 reduceNode Failed 重要 一般是由于底层释放资源失败等原因导致。 请工单联系运维后台处理资源。 节点缩容失败 重启实例失败 restartInstance Failed 重要 一般是由于底层关联数据库实例异常等原因导致。 建议先排查底层数据库实例是否异常,如果无异常请工单联系运维进行排查。 部分节点业务中断 创建逻辑库失败 createLogic DbFailed 重要 一般是由于以下几种原因导致的: 1、数据库实例账号密码错误; 2、DRDS实例与底层数据库实例安全组设置错误,导致无法通信。 请排查: 1、数据库实例账号密码是否错误; 2、DRDS实例与底层数据库实例安全组是否设置正确等问题。 业务无法正常运行 绑定弹性公网IP失败 bindEipFailed 重要 一般是由于EIP服务繁忙。 稍后重试,紧急情况下请联系运维排查问题。 无法通过公网访问服务 逻辑库扩容失败 migrateLogic DbFailed 重要 一般是由于底层处理失败。 请工单联系运维处理。 无法实现逻辑库扩容 逻辑库扩容重试失败 retryMigrate LogicDbFailed 重要 一般是由于底层处理失败。 请工单联系运维处理。 无法实现逻辑库扩容
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        分布式关系型数据库DRDS支持的事件列表
      • 云数据库GaussDB NoSQL支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 创建实例业务失败 NoSQLCreateInstanceFailed 重要 一般是由于实例配额不足或底层资源不足等原因导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 变更规格失败 NoSQLResizeInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试规格变更操作。 业务中断。 添加节点失败 NoSQLAddNodesFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 删除节点失败 NoSQLDeleteNodesFailed 重要 一般是由于底层释放资源失败导致。 重新尝试删除节点。 无 扩卷失败 NoSQLScaleUpStorageFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩卷操作。 如果磁盘满,会导致业务中断。 重置密码失败 NoSQLResetPasswordFailed 重要 一般是由于重置密码命令超时导致。 重新尝试重置密码操作。 无 修改参数组失败 NoSQLUpdateInstance ParamGroupFailed 重要 一般是由于修改参数组命令超时导致。 重新尝试修改参数组操作。 无 设置备份策略失败 NoSQLSetBackupPolicyFailed 重要 一般是由于数据库连接异常导致。 重新重试设置备份策略操作。 无 创建手动备份失败 NoSQLCreateManualBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 创建自动备份失败 NoSQLCreateAutomatedBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 实例运行状态异常 NoSQLFaultyDBInstance 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 NoSQLDBInstanceRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 NoSQLFaultyDBNode 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 NoSQLDBNodeRecovered 重要 针对灾难性的故障,NoSQL有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 实例主备切换 NoSQLPrimaryStandbySwitched 重要 在手动触发的主备倒换或节点故障自动触发的故障倒换场景下,会上报该事件。 不需要处理。 无 出现热点分区键 HotKeyOccurs 重要 客观上是因为主键设置不合理,使得热点数据集中分布在一个分区。 客户端不合理的应用程序设计,造成对某一key的频繁读写。 1. 选择合理的分区键。 2. 业务增加缓存,业务应用先从缓存中读取热点数据。 影响业务请求成功率,存在影响集群性能及稳定性的风险。 出现超大分区键 BigKeyOccurs 重要 主键设计不合理,单个分区的记录数或数据量过大,引起了节点负载不均。 1. 选择合理的分区键 2. 基于现有分区键,增加分区键散列。 随着数据量增长,集群稳定性会下降。 数据盘空间不足 NoSQLRiskyDataDiskUsage 重要 数据盘空间不足,产生此告警。 请参见对应服务用户指南中“扩容磁盘”的内容,进行磁盘扩容。 实例被设为只读模式,数据无法写入。 数据盘空间已扩容并恢复可写 NoSQLDataDiskUsageRecovered 重要 数据盘空间已扩容并恢复可写,产生此事件。 无需处理。 无 创建索引失败 NoSQLCreateIndexFailed 重要 业务负载超过实例规格瓶颈,此时再创建索引会耗费更多实例资源,导致响应变慢甚至卡顿,最终超时,引起索引创建失败。 1、根据业务负载,选择匹配的实例规格 2、在业务低峰期创建索引 3、使用后台方式创建索引 4、索引字段,结合业务进行合理选择。 索引创建失败或不完整,导致索引无效,需要删掉索引重新创建。 发生写入降速 NoSQLStallingOccurs 重要 写入速度快,接近集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 发生写入停止 NoSQLStoppingOccurs 重要 写入速度过快,达到集群规模和实例规格范围允许最大写能力,从而触发数据库自身的限流机制,会发生请求失败情况 1. 根据业务的最大写请求速率,调整集群规模或者节点规格 2. 衡量业务的最大写请求速率,分散业务写峰值速率 影响业务的请求的成功率 重启数据库失败 NoSQLRestartDBFailed 重要 一般是由于实例状态异常等原因导致。 提交工单让运维处理。 数据库实例状态可能存在异常。 恢复到新实例失败 NoSQLRestoreToNewInstanceFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,重新尝试添加新节点。 无法恢复到新的数据库实例。 恢复到已有实例失败 NoSQLRestoreToExistInstanceFailed 重要 一般是由于备份文件下载或恢复失败等原因导致。 提交工单让运维处理。 当前数据库实例可能处于不可用状态。 删除备份文件失败 NoSQLDeleteBackupFailed 重要 一般是由于备份文件从obs删除失败导致。 重新尝试删除备份文件。 无 切换慢日志明文开关失败 NoSQLSwitchSlowlogPlainTextFailed 重要 一般是由于引擎不支持切换等原因导致。 请查阅NoSQL用户指南,确认引擎支持打开慢日志明文开关。提交工单让运维处理。 无 绑定EIP失败 NoSQLBindEipFailed 重要 一般是由于节点状态不正常,节点已经绑定EIP或EIP非法等原因导致。 检查节点是否正常,EIP是否合法。 无法通过公网访问数据库实例。 解绑EIP失败 NoSQLUnbindEipFailed 重要 一般是由于节点状态不正常,节点已经未绑定EIP等原因导致。 检查节点和EIP状态是否正常。 无 修改参数失败 NoSQLModifyParameterFailed 重要 一般是由于参数取值非法等原因导致。 排查参数值是否符合在合法范围内,提交工单让运维处理。 无 参数组应用失败 NoSQLApplyParameterGroupFailed 重要 一般是由于实例状态异常导致参数组无法应用等原因导致。 提交工单让运维处理。 无 开启或关闭SSL失败 NoSQLSwitchSSLFailed 重要 一般是由于修改SSL命令超时导致。 重新提交一次或者提交工单处理,并先保持切换之前使用SSL的连接方式。 是否使用SSL连接。 单行数据量太大 LargeRowOccurs 重要 用户单行数据量过大,可能会导致查询超时,进而节点OOM异常退出等各种故障发生。 1. 对每列和每行的写入长度做限制,遵从规范,使得单行的的key和value长度和不超过阈值。 2. 排查业务是否出现异常写入和异常编码,导致写入大row。 过大的单行记录,随着数据量增长,集群稳定性会下降。 用户计划删除KMS密钥 NoSQLplanDeleteKmsKey 重要 一般是由于用户计划删除kms的key导致。 计划删除kms的key后,及时恢复kms的key或者及时解密数据。 kms的key被删除后用户无法进行磁盘加密。 查询墓碑数过多 TooManyQueryTombstones 重要 查询墓碑数过多,可能会导致查询超时,影响查询性能。 使用合理的查询删除方式,避免大批次的范围查询 可能会导致查询超时,影响查询性能。 超大集合列 TooLargeCollectionColumn 重要 当集合列元素个数太多时,会出现集合列查询失败。 对集合列的元素个数做限制,遵从规范不超过阈值。 排查业务是否出现异常写入和异常编码,导致写入大集合列。 会出现集合列查询失败。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        云数据库GaussDB NoSQL支持的事件列表
      • 企业交换机ESW支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 IP地址冲突 IPConflict 重要 L2互联场景:一般是由于线上(本端子网)与线下(远端网段)存在相关IP地址的主机导致。 通过查看ARP、交换机信息等措施,排查出具体IP冲突的主机, 根据业务场景调整IP避免冲突。 可能导致冲突IP相关网络通信异常。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        企业交换机ESW支持的事件列表
      • 弹性负载均衡ELB支持的事件列表
        弹性负载均衡ELB支持的事件列表 事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 健康检查异常 healthCheckUnhealthy 重要 一般是由于后端服务器服务离线导致。事件上报一定次数后,不再上报。 检查后端服务器的服务运行状态。 ELB不会往异常的后端转发流量,如果云主机组下只有一个后端,则业务会中断。 健康检查恢复正常 healthCheckRecovery 次要 后端服务器健康检查恢复正常。 无需处理。 负载均衡器到后端服务器流量恢复正常。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        弹性负载均衡ELB支持的事件列表
      • Agent支持的操作系统有哪些?
        系统(64bit) 版本 SUSE Enterprise11 SP4,Enterprise12 SP1 CentOS 6.9,7.2,7.3
        来自:
        帮助文档
        云监控服务
        常见问题
        主机监控类
        Agent支持的操作系统有哪些?
      • 执行命令安装Agent报错该如何处理?
        安装Agent报错如何处理。 问题现象 使用CES控制台提供的Agent安装命令安装CES Agent时出现报错”/usr/local/uniagent/bin/uniagent: No such file or directory”,导致Agent安装失败。报错如下图所示。 图 :安装Agent失败 问题分析 待安装的CES Agent版本暂未适配部分ARM镜像,导致您安装Agent的过程中出现该错误。 解决方式 1. 执行以下命令创建软连接: plaintext ln s /lib/ldlinuxaarch64.so.1 /lib64/ldlinuxaarch64.so.1 2. 重新执行Agent安装命令。
        来自:
        帮助文档
        云监控服务
        常见问题
        主机监控类
        执行命令安装Agent报错该如何处理?
      • EIP支持的事件列表
        事件名称 事件级别 事件说明 处理建议 事件影响 EIP带宽超限事件 重要 当前使用带宽已超过购买的带宽,可能会导致网络变慢或丢包发生。 该事件取值为周期内的最大值,而EIP的出入网带宽指标数据,取值为周期时间点的值。 其中: “egressDropBandwidth”为本周期内出云丢弃带宽值(Byte), “egressAcceptBandwidth”为本周期内出云通过带宽值(Byte), “egressMaxBandwidthPerSec”为本周期内出云带宽峰值(Byte/s), “ingressAcceptBandwidth”为本周期内入云通过带宽值(Byte), “ingressMaxBandwidthPerSec”为本周期内入云带宽峰值(Byte/s), “ingressDropBandwidth”为本周期内入云丢弃带宽值(Byte)。 检查EIP带宽是否一直增加,业务是否正常,并考虑扩容。 网络变慢或丢包发生 释放EIP 次要 EIP资源被删除。 检查是否误操作删除资源。 无法访问公网 EIP封堵 紧急 带宽超过5GB就会封堵,相当于把流量直接丢弃。带宽严重超限或受到攻击,一般是受到了DDoS攻击。 更换EIP,避免业务受到影响。 同时查看事件中的封堵原因,进行相应处理。 业务受影响 EIP解封 紧急 EIP封堵已被解封。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        EIP支持的事件列表
      • 云数据库GaussDB支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 进程状态告警 ProcessStatusAlarm 重要 GaussDB关键进程退出,包括:CMS/CMA、ETCD、GTM、CN、DN。 等待进程自动恢复或者自动主备切换,观察业务是否恢复。 如果业务未恢复,联系SRE。 主机进程故障,在主机上进行的业务将中断回滚。 备机进程故障不影响业务。 组件状态告警 ComponentStatusAlarm 重要 GaussDB关键组件无响应,包括:CMA、ETCD、GTM、CN、DN。 等待进程自动恢复或者自动主备切换,观察业务是否恢复。 如果业务未恢复,联系SRE。 主机进程无响应,在主机上进行的业务将无响应。 备机进程故障不影响业务。 集群状态告警 ClusterStatusAlarm 重要 集群状态异常,包括:集群只读、ETCD多数派故障、集群分布不均衡。 联系SRE。 集群只读:业务只读。 ETCD多数派故障:集群不可用。集群分布不均衡:集群性能/可靠性降低。 硬件资源告警 HardwareResourceAlarm 重要 集群中出现严重的硬件故障,包括:磁盘损坏、GTM网络通信故障。 联系SRE。 业务部分/全部受损。 状态转换告警 StateTransitionAlarm 重要 集群出现如下重要事件: DN build/build失败、DN强切、DN主备切换/failover、GTM主备切换/failover。 等待自动恢复,观察业务是否恢复。如果业务未恢复,联系SRE。 部分业务受损。 其他异常告警 OtherAbnormalAlarm 重要 磁盘使用阈值告警等。 关注业务变化,及时计划扩容。 超过使用阈值,将无法扩容。 实例运行状态异常 TaurusInstanceRunningStatusAbnormal 重要 由于灾难或者物理机故障导致实例故障时,会上报该事件,属于关键告警事件。 提交工单。 可能导致数据库服务不可用。 实例运行状态异常已恢复 TaurusInstanceRunningStatusRecovered 重要 针对灾难性的故障,GaussDB有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 节点运行状态异常 TaurusNodeRunningStatusAbnormal 重要 由于灾难或者物理机故障导致数据库节点故障时,会上报该事件,属于关键告警事件。 检查数据库服务是否可以正常使用,并提交工单。 可能导致数据库服务不可用。 节点运行状态异常已恢复 TaurusNodeRunningStatusRecovered 重要 针对灾难性的故障,GaussDB有高可用工具会自动进行恢复或者手动恢复,执行完成后会上报该事件。 不需要处理。 无 创建实例业务失败 GaussDBV5CreateInstanceFailed 重要 创建实例失败产生的事件,一般是配额大小不足,底层资源耗尽导致。 先释放不再使用的实例再尝试重新发放,或者提交工单调整配额上限。 无法创建数据库实例。 添加节点失败 GaussDBV5ExpandClusterFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源,删除添加失败的节点,重新尝试添加新节点。 无 存储扩容失败 GaussDBV5EnlargeVolumeFailed 重要 一般是由于底层资源不足等原因导致。 提交工单让运维在后台协调资源再重试扩容操作。 如果磁盘满,会导致业务中断。 重启失败 GaussDBV5RestartInstanceFailed 重要 一般是由于网络问题等原因导致 重试重启操作或提交工单让运维处理。 可能导致数据库服务不可用。 全量备份失败 GaussDBV5FullBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 差量备份失败 GaussDBV5DifferentialBackupFailed 重要 一般是备份文件导出失败或上传失败等原因导致。 提交工单让运维处理。 无法备份数据。 删除备份失败 GaussDBV5DeleteBackupFailed 重要 无需实现。 绑定EIP失败 GaussDBV5BindEIPFailed 重要 弹性公网IP已被占用或IP资源等原因导致。 提交工单让运维处理。 导致实例无法使用公网链接或访问 解绑EIP失败 GaussDBV5UnbindEIPFailed 重要 网络故障或公网EIP服务故障等原因导致。 重新解绑Ip或提交工单让运维处理。 可能导致IP资源残留 参数组应用失败 GaussDBV5ApplyParamFailed 重要 一般是由于修改参数组命令超时导致。 重新尝试修改参数组操作。 无 参数修改失败 GaussDBV5UpdateInstanceParamGroupFailed 重要 一般是由于修改参数组命令超时导致。 重新尝试修改参数组操作。 无 备份恢复失败 GaussDBV5RestoreFromBcakupFailed 重要 一般是由底层资源不足或备份文件下载失败等原因导致 提交工单。 可能导致在恢复失败期间数据库服务不可用
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        云数据库GaussDB支持的事件列表
      • 对象存储OBS支持的事件列表
        事件名称 事件ID 事件级别 删除桶 deleteBucket 重要 删除桶policy配置 deleteBucketPolicy 重要 设置桶的ACL setBucketAcl 次要 设置桶的策略 setBucketPolicy 次要
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        对象存储OBS支持的事件列表
      • 弹性云主机ECS支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 删除虚拟机 deleteServer 重要 删除云服务器。 包括: 1. 在管理控制台进行删除操作。 2. 通过API接口下发删除指令。 确认删除操作是否为主动执行。 业务中断。 重启虚拟机 rebootServer 次要 云服务器重启。 包括: 1. 在管理控制台进行重启操作。 2. 通过API接口下发重启指令。 1. 确认操作是否为主动执行。 2. 业务应用做成高可用。 3. 云主机开机后,确认业务是否自动恢复。 业务中断。 关闭虚拟机 stopServer 次要 云服务器关机。 包括: 1. 在管理控制台进行关机操作。 2. 通过API接口下发关机指令。 1. 确认操作是否为主动执行。 2. 业务应用做成高可用。 3. 云主机开机后,确认业务是否自动恢复。 业务中断。 删除网卡 deleteNic 重要 云服务器删除网卡。 包括: 1. 在管理控制台删除网卡。 2. 通过API接口下发删除网卡指令。 1. 确认操作是否为主动执行。 2. 业务应用做成高可用。 3. 删除网卡后,确认业务是否自动恢复。 网卡被删除,存在业务中断的可能。 变更规格 resizeServer 次要 云服务器规格变更。 包括: 1. 在管理控制台进行变更规格。 2. 通过API接口下发变更规格指令。 1. 确认操作是否为主动执行。 2. 业务应用做成高可用。 3. 变更规格后,确认业务是否自动恢复。 业务中断。 因硬件故障触发重启 startAutoRecovery 重要 弹性云主机所在的主机出现故障时,系统会自动将弹性云主机迁移至正常的物理机, 迁移过程中系统会自动重启云主机。 等待恢复成功,观察业务是否受到影响。 业务存在中断的可能。 因硬件故障重启已完成 endAutoRecovery 重要 当自动迁移完成后,弹性云主机已恢复正常。 当收到“恢复成功”时,云服务器已正常工作,可继续使用。 业务恢复正常。 恢复超时(后台处理中) faultAutoRecovery 重要 迁移弹性云主机至正常的物理机操作超时。 迁移业务至其他云服务器。 业务中断。 开机失败 faultPowerOn 重要 云主机开机失败。 重试开机,若仍开机失败,联系运维人员处理。 云服务器无法开机。 GPU链路故障 GPULinkFault 紧急 弹性云主机所在的主机上GPU卡故障。 包括: 1. GPU卡故障。 2. GPU卡故障恢复中。 业务应用做成高可用。GPU卡故障恢复后,确认业务是否自动恢复。 业务中断。 主机进程异常导致虚拟机故障 VMFaultsByHostProcessExceptions 紧急 云服务器所在宿主机服务进程异常,导致云服务器故障。 联系运维人员处理 云服务器故障。 GuestOS系统层重启告警 RestartGuestOS 一般 GuestOS内部重启。 联系运维人员处理。 在系统重启场景下,可能导致业务中断。 实例计划规格变更等待执行 instanceresizescheduled 重要 实例在计划时间规格变更,任务等待执行。 确认执行窗口对业务的影响。 实例等待执行规格变更操作。 实例计划迁移等待执行 instancemigratescheduled 重要 由于底层硬件、系统运维等影响,实例在计划时间迁移,任务等待执行。 确认执行窗口对业务的影响。 实例等待执行迁移操作。 实例计划停止等待执行 instancestopscheduled 重要 由于底层硬件、系统运维等影响,实例在计划时间停止,任务等待执行。 确认执行窗口对业务的影响。 实例中止等待。 实例计划重启等待执行 instancerebootscheduled 重要 由于底层硬件、系统运维等影响,实例在计划时间重启,任务等待执行。 确认执行窗口对业务的影响。 实例等待执行重启。 实例计划重新部署等待执行 instanceredeployscheduled 重要 由于底层硬件、系统运维等影响,实例在计划时间重新部署到新主机,任务等待执行。 确认执行窗口对业务的影响。 实例等待执行重部署。 GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。 如果业务受损,请提交工单。 可能GPU硬件问题导致SRAM故障,导致业务异常退出。 GPU存在infoROM告警 gpuInfoROMAlarm 重要 GPU可能存在硬件问题,导致驱动读取不到inforom信息。 非敏感业务可以继续使用该GPU卡,敏感业务请提交工单。 对业务暂时没有影响,当GPU硬件出现ECC故障时,可能无法自动完成故障页隔离,导致业务受损。 GPU发生double bit ECC告警 doubleBitEccError 重要 GPU硬件存在double bit ECC故障。 如果业务受损停止,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU隔离页过多告警 gpuTooManyRetiredPagesAlarm 重要 GPU硬件存在过多ECC隔离页。 如果业务受损,请提交工单。 GPU硬件存在过多ECC故障,可能频繁影响业务正常运行。 GPU A100 硬件发生ECC告警 gpuA100EccAlarm 重要 GPU卡出现ECC硬件故障。 如果业务受损停止,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU ECC内存页隔离失败告警 eccPageRetirementRecordingFailure 重要 GPU硬件存在ECC故障,驱动自动隔离内存页时失败。 如果业务受损,请提交工单。 可能会造成业务中断,故障页隔离隔离失败,可能导致业务无法使用GPU。 GPU ECC页隔离告警 eccPageRetirementRecordingEvent 一般 存在ECC硬件错误,发生内存页自动隔离。 如果业务受损停止,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 一般随ECC故障告警出现,单独出现不影响业务。 GPU single bit ECC过多告警 highSingleBitEccErrorRate 重要 ECC硬件存在过高ECC single bit错误。 如果业务受损停止,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 single bit的错误能够自动恢复,一般不影响GPU相关应用程序。 GPU驱动掉卡告警 gpuDriverLinkFailureAlarm 重要 GPU链路正常,NVIDIA驱动找不到GPU硬件 建议尝试重启虚拟机恢复业务。如果业务仍然无法恢复,请提交工单。 一般驱动问题导致找不到对应位置的GPU。 GPU卡链路故障告警 gpuPcieLinkFailureAlarm 重要 GPU链路异常,通过lspci查看GPU硬件出现故障。 如果业务受损,请提交工单。 硬件问题导致GPU链路异常,驱动无法使用GPU。 虚拟机GPU丢卡告警 vmLostGpuAlarm 重要 虚拟机实际有的GPU卡数量比规格里应分配的GPU卡数量少。 如果业务受损,请提交工单。 虚拟机GPU卡丢失。 GPU显存页告警 gpuMemoryPageFault 重要 GPU内存页发生故障,故障可能由应用、驱动或硬件引起 如果业务受损,请提交工单。 可能GPU硬件问题导致显存故障,导致业务异常退出。 GPU图像引擎异常告警 graphicsEngineException 重要 GPU图像引擎发生故障,可能由应用、驱动或硬件引起。 如果业务受损,请提交工单。 可能GPU硬件问题导致图像引擎故障,导致业务异常退出。 GPU温度过高告警 highTemperatureEvent 重要 GPU硬件温度过高。 如果业务受损,请提交工单。 GPU温度超过温度阈值,可能会引起GPU卡性能下降。 GPU NVLINK链路错误告警 nvlinkError 重要 NVLINK的链路出现硬件故障 如果业务受损,请提交工单。 NVLINK链路故障,影响业务使用GPU NVLINK能力。 nvidiasmi命令卡住 nvidiaSmiHangEvent 重要 nvidiasmi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。 开始热迁移 liveMigrationStarted 重要 弹性云主机所在的主机可能出现故障,提前对虚拟机进行热迁移,避免宕机后导致业务中断。 等待虚拟机迁移成功,状态恢复正常。 实例热迁移开始。 结束热迁移 liveMigrationCompleted 重要 热迁移已经结束,弹性云主机已恢复正常。 确认业务是否受到影响。 实例热迁移结束。 热迁移失败 liveMigrationFailed 重要 弹性云主机热迁移出现问题,未热迁移成功。 确认应用集群业务是否受损。 实例热迁移失败。 宿主机存在宕机风险 hostMayCrash 重要 弹性云主机所在的宿主机存在宕机风险,且由于一些原因,无法通过热迁移手段规避该风险。 确认应用集群业务是否受损。 实例有重启风险。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        弹性云主机ECS支持的事件列表
      • 云服务备份CBR支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 创建备份失败 backupFailed 紧急 创建备份失败 尝试手动创建备份或者联系技术支持 可能造成数据丢失 使用备份恢复资源失败 restorationFailed 紧急 使用备份恢复资源失败 尝试使用其他备份恢复或者联系技术支持 可能造成数据丢失 备份删除失败 backupDeleteFailed 紧急 备份删除失败 稍后重试删除或者联系技术支持 可能造成计费异常 存储库删除失败 vaultDeleteFailed 紧急 储存库删除失败 稍后重试或联系技术支持 可能造成计费异常 复制失败 replicationFailed 紧急 备份复制失败 稍后重试或联系技术支持 可能造成数据丢失 创建备份成功 backupSucceeded 重要 创建备份成功 无 无 使用备份恢复资源成功 restorationSucceeded 重要 使用备份恢复资源成功 观察数据是否已成功恢复。 无 备份删除成功 backupDeletionSucceeded 重要 备份删除成功 无 无 存储库删除成功 vaultDeletionSucceeded 重要 储存库删除成功 无 无 复制成功 replicationSucceeded 重要 备份复制成功 无 无 客户端离线 agentOffline 紧急 客户端离线 请确保客户端状态正常且能够正常连接。 可能造成备份任务失败。 客户端上线 agentOnline 重要 客户端上线 无。 无。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        云服务备份CBR支持的事件列表
      • 物理机支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 GPU SRAM存在 Uncorrectable ECC告警 SRAMUncorrectableEccError 重要 GPU卡SRAM出现Uncorrectable ECC Error硬件故障。 如果业务受损,请提交工单。 可能GPU硬件问题导致SRAM故障,导致业务异常退出 主机重启 osReboot 重要 物理机实例重启。 包括: 1. 在管理控制台进行重启操作 2. 通过API接口下发重启指令 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 业务中断 异常重启 serverReboot 重要 物理机实例异常重启。 包括: 1. 操作系统异常导致重启 2. 主机硬件故障导致重启 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 业务中断 主机关机 osShutdown 重要 物理机实例关机。 包括: 1. 在管理控制台进行关机操作 2. 通过API接口下发关机指令 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 业务中断 异常关机 serverShutdown 重要 物理机实例异常关机。 包括: 1. 主机异常下电 2. 主机硬件故障导致关机 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 业务中断 网络中断 linkDown 重要 物理机网络中断。 包括: 1. 主机异常关机、重启 2. 交换机故障引起的网络中断 3. 网关节点故障引起的中断 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 业务中断 PCIE异常 pcieError 重要 物理机PCIe设备硬件故障。 包括: 1. 主板故障 2. PCIe设备故障 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 影响网络或硬盘读写业务 硬盘故障 diskError 重要 物理机磁盘故障。 包括: 1. 硬盘背板故障 2. 硬盘本身故障 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 影响数据读写业务或主机无法启动 云存储连接异常 storageError 重要 物理机云硬盘链接异常。 包括: 1. SDI卡故障 2. 远端存储故障 1. 业务应用做成高可用。 2. 主机恢复后,确认业务是否自动恢复。 影响数据读写业务或主机无法启动 GPU存在infoROM告警 gpuInfoROMAlarm 重要 GPU可能存在硬件问题,导致驱动读取不到inforom信息。 业务可以继续使用该GPU卡,不敏感业务可以继续使用,敏感业务请提交工单处理。 对业务暂时没有影响,当GPU硬件出现ECC故障时,可能无法自动完成故障页隔离,导致业务受损。 GPU发生double bit ECC告警 doubleBitEccError 重要 GPU硬件存在double bit ECC故障。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU隔离页过多告警 gpuTooManyRetiredPagesAlarm 重要 GPU硬件存在过多ECC隔离页。 如果业务受损,请提交工单。 GPU硬件存在过多ECC故障,可能频繁影响业务运行。 GPU A100 硬件发生ECC告警 gpuA100EccAlarm 重要 GPU卡出现ECC硬件故障。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离后业务可继续正常使用GPU。 GPU ECC内存页隔离失败告警 eccPageRetirementRecordingFailure 重要 GPU硬件存在ECC故障,驱动自动隔离这些页时失败。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 可能会造成业务中断,故障页隔离隔离失败,可能导致业务无法使用GPU。 GPU ECC页隔离告警 eccPageRetirementRecordingEvent 一般 存在ECC硬件错误,发生内存页自动隔离。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 一般随ECC故障告警出现,单独出现不影响业务。 GPU single bit ECC过多告警 highSingleBitEccErrorRate 重要 ECC硬件存在过高ECC single bit错误。 如果业务受损停止,则重启业务恢复。 如果业务无法启动,建议尝试重启虚拟机恢复业务。 如果业务仍然无法恢复,请提交工单。 single bit的错误能够自动恢复,一般不影响GPU相关应用程序。 GPU驱动掉卡告警 gpuDriverLinkFailureAlarm 重要 GPU链路正常,NVIDIA驱动找不到GPU硬件。 建议尝试重启虚拟机恢复业务。如果业务仍然无法恢复,请提交工单。 一般驱动问题导致找不到对应位置的GPU。 GPU卡链路故障告警 gpuPcieLinkFailureAlarm 重要 GPU链路异常,通过lspci无法查看GPU硬件信息。 如果业务受损,请提交工单。 硬件问题导致GPU卡链路异常,驱动无法使用GPU。 虚拟机GPU丢卡告警 vmLostGpuAlarm 重要 虚拟机实际有的GPU卡数量比规格里应分配的GPU卡数量少。 如果业务受损,请提交工单。 虚拟机GPU卡丢失。 GPU显存页告警 gpuMemoryPageFault 重要 GPU显存页发生故障,故障可能由应用、驱动或硬件引起。 如果业务受损,请提交工单。 可能GPU硬件问题导致显存故障,导致业务异常退出 GPU图像引擎异常告警 graphicsEngineException 重要 GPU图像引擎发生故障,可能由应用、驱动或硬件引起。 如果业务受损,请提交工单。 可能GPU硬件问题导致图像引擎故障,导致业务异常退出。 GPU温度过高告警 highTemperatureEvent 重要 GPU硬件温度过高。 如果业务受损,请提交工单。 GPU温度超过温度阈值,可能会引起GPU卡性能下降 GPU NVLINK链路错误告警 nvlinkError 重要 NVLINK的链路出现硬件故障。 如果业务受损,请提交工单。 NVLINK链路故障,影响业务使用GPU nvlink能力。 nvidiasmi命令卡住 nvidiaSmiHangEvent 重要 nvidiasmi命令超时,该命令可能卡住 如果业务受损,请提交工单。 可能是命令执行过程中,触发驱动问题,导致命令卡住,同时可能出现业务使用驱动报错问题。
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        物理机支持的事件列表
      • 虚拟私有云VPC支持的事件列表
        事件名称 事件ID 事件级别 删除VPC deleteVpc 重要 修改VPC modifyVpc 次要 删除Subnet deleteSubnet 次要 修改Subnet modifySubnet 次要 修改带宽 modifyBandwidth 次要 删除VPN deleteVpn 重要 修改VPN modifyVpn 次要
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        虚拟私有云VPC支持的事件列表
      • 获取钉钉机器人Webhook地址
        若需配置钉钉群接收告警,或在联系人模块中添加钉钉机器人,需先在目标钉钉群内获取自定义机器人的 Webhook 地址。本文将详细介绍获取该地址的具体操作流程。 前提条件 已在钉钉中创建需要接受告警的钉钉群。 操作步骤 1. 进入PC版钉钉,打开所需要添加报警机器人的钉钉群,并单击右上角的群设置图标。 2. 在群设置 面板中点击机器人添加机器人。 3. 选择添加自定义。 4. 在机器人详情 对话框单击添加。 5. 在添加机器人对话框中执行以下操作。 1. 设置机器人头像和名字。 2. 安全设置 选中自定义关键词,可设置关键词为告警。 3. 选中我已阅读并同意《自定义机器人服务及免责条款》。 4. 单击完成。 6. 完成后即可复制机器人webhook地址。 相关文档 获取到自定义机器人Webhook地址之后,您可以参考【钉钉机器人】,创建接收告警的钉群对象。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        告警管理(新版)
        告警通知对象
        获取钉钉机器人Webhook地址
      • 联系人(1)
        当通知策略的匹配条件被触发时,系统可向您指定的联系人发送通知信息。联系人可通过电话、短信及邮件等多种渠道接收相关告警通知。 创建联系人 1. 登录控【应用性能监控制台】,在左侧导航栏选择告警管理 > 通知对象。 2. 在联系人 页签单击新建联系人。 3. 在新建联系人 对话框中根据实际需求设置以下参数,然后单击确认。 参数 说明 姓名 自定义联系人姓名。 手机号 设置联系人的手机号码后,可以通过电话和短信的方式接收告警通知。 说明 仅验证过的手机号码可以在通知策略中使用电话的通知方式,验证手机号的操作,请参见【验证手机号】。 邮箱 设置联系人的邮箱地址后,可以通过邮箱接收告警通知。 联系人组 选择联系人需要加入的联系人组。创建联系人组的操作,请参见【联系人组】。 注意 手机号码和邮箱至少填写一项,每个手机号码或邮箱只能用于一个联系人。 验证手机号 仅验证过的手机号可以在通知策略中使用电话的通知方式。 1. 在联系人 页签上,单击未验证手机号右侧的待验证。 2. 在弹出的界面中,点击发送验证码,系统将会给手机号发送验证短信。 3. 输入短信验证码,点击确定,即可完成手机号验证。 管理联系人 创建联系人后,您可以在联系人页签查询、编辑或删除联系人: 编辑联系人:单击目标联系人右侧操作 列中的编辑 ,在弹出的对话框中修改联系人信息,然后单击确认。 删除单个联系人:单击目标联系人右侧操作 列中的删除 ,然后在弹出的对话框中单击确认。 删除多个联系人:选择目标联系人,单击批量删除 ,然后在提示对话框中单击确认。
        来自:
      • 为Java应用手动安装Agent的FAQ
        为Java应用手动安装Agent,您可能会遇到如下问题。 APM Agent和其他APM产品Agent(例如SkyWalking)是否兼容? APM Agent是基于opentelemetry开源项目的Agent进行的二次开发,和其他APM产品Agent都不兼容。APM大多是基于ASM框架进行字节码插桩实现的,同时安装两个Agent相当于对您的代码插桩两次,由于不同厂家的插装代码实现不同,代码冲突可能造成各类问题(例如应用启动缓慢,类冲突等问题),因此强烈建议您不要同时安装多个APM Agent。 如何检查APM Agent是否安装成功 使用ps命令查看命令行启动参数中是否成功安装APM Agent。 ps ef grep 'ctyunArmsAgent' 成功安装时,如下图所示:
        来自:
        帮助文档
        应用性能监控 APM
        常见问题
        操作类
        为Java应用手动安装Agent的FAQ
      • 启停设置
        您可以启用或停止应用上报,停止后将不再产生上报统计。 功能入口 1. 选择目标资源池,并登录 FMS 组件控制台 2. 在左侧导航栏中选择「设置」 3. 在顶部导航栏中选择「启停设置」 操作步骤 1. 修改「运行状态」开关 2. 若改为「停止」状态,您可以选择次日自动启动或不自动启动
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        前端监控
        控制台操作指南
        应用设置
        启停设置
      • 用量统计
        展示当前租户下的上报数据量情况,包括各种不同类型的数据上报量。 功能入口 1. 选择目标资源池,并登录 FMS 组件控制台。 2. 在左侧导航栏中选择「用量统计」。 功能说明 左上角可以筛选特定应用的用量: 右上角可以筛选特定时间范围的用量: 下方为以小时/天为单位统计的各类型数据上报量: 注意,这里的上报量指具体日志条数,SDK 会将多条日志合并到一条上报请求中,即一次上报对应多条日志。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        前端监控
        控制台操作指南
        用量统计
      • Agent版本说明
        本文主要介绍了APM的Java Agent的版本更新历史。 Java Agent版本 版本 描述 1.1.1 1、增加Javaagent关键内置对象指标 2、修复集成Nacos的内存占用问题 1.2.0 1、修复Springboot 2.5.15版本引用的Tomcat 9.0.75出现接口404问题 2、修复Agent运行一段时间后上报数据异常问题 3、优化Agent内存占用 1.4.0 1、优化应用配置下发通道 2、修复异常数统计不准问题 3、修复Localhost显示Ipv6地址问题 1.5.0 1、新增Header和URL参数拦截功能 2、新增Netty内存指标展示 3、新增自定义URL状态码功能 4、新增自定义慢请求阈值 5、新增URL采集黑名单 1.5.1 1、新增Java方法拦截功能 2、新增Elasticsearch、Mongodb、Clickhouse等数据库指标展示 3、新增C3P0、DBCP、Druid等数据库连接池指标展示 4、新增Tomcat连接池指标展示 5、新增耗时区间分布统计 6、新增解析特定业务返回码功能 7、新增URL级别慢请求采样率设置功能
        来自:
        帮助文档
        应用性能监控 APM
        产品介绍
        Agent版本说明
      • 用量统计
        展示当前租户下的探针用量情况,包括实例数、探针时、Span存储量。 功能入口 1. 选择目标资源池,并登录APM组件控制台。 2. 在左侧导航栏中选择「系统管理 」「用量统计」。 功能说明 关键指标 以Javaagent方式接入 APM AgentHour:筛选时间段内,已消耗的探针时 以其他方式接入 Span上报量:筛选时间段内,上报过的Span总数 Span存储量:筛选时间段内,存储过的Span总数。 用量趋势 根据应用接入方式不同进行区分。以Javaagent方式接入的展示APM AgentHour的趋势图;以其他方式接入展示Span上报量趋势图和Span存储量趋势图。
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        系统管理
        用量统计
      • 应用总览
        您可以查看前端应用访问、错误、API 请求及性能数据总览。 功能入口 1. 选择目标资源池,并登录 FMS 组件控制台 2. 在左侧导航栏中选择「总览」 功能详情 以下图表数据可以通过点击右上方的「导出」按钮保存为数据表格。 访问数据总览 错误总览 API 请求总览 访问速度
        来自:
        帮助文档
        应用性能监控 APM
        用户指南
        前端监控
        控制台操作指南
        应用总览
      • 费用账单
        如果您需要查看费用账单信息,可以在费用中心账单管理进行查看。 查看账单概览 1、进入“费用中心>账单管理>账单概览”页面; 2、点击“账期”下拉框,设置想要查看的账期月份。 详情见账单概览。 查看账单流水 1、进入“费用中心>账单管理>流水账单”页面; 2、设置计费模式、账期、订单号等查询条件,查看流水账单数据; 详情见流水账单。
        来自:
        帮助文档
        应用性能监控 APM
        计费说明
        费用账单
      • 日志中心
        字段 说明 starttime 请求开始时间 request 请求信息 serviceid 服务id server 网关节点信息 apisixlatency 网关自身处理耗时(不包括上游服务耗时) latency 总请求耗时(网关处理耗时和上游服务耗时之和) clientip 客户端IP response 应答信息 upstream 上游信息,包括上游地址,上游返回的HTTP状态码,上游耗时;当服务访问异常时可以重点关注此字段,确认是否时上游服务出了问题。 routeid 路由id routename 路由名称
        来自:
        帮助文档
        微服务引擎
        用户指南
        云原生网关
        监控分析
        日志中心
      • 观测与监控数据加工任务
        本文介绍数据加工任务运行的指标详情。 操作入口 1. 登录云日志服务控制台。 2. 点击左侧菜单栏数据加工。 3. 点击目标数据加工任务名称,进入加工任务详情页面。 总览指标 加工速率:默认时间周期为1小时,统计窗口为1分钟,速率为数据条目数/秒。 read:从源日志单元中读到的数据条数。 delivered:成功写入到目标日志单元的数据条数。 dropped:在加工过程中丢弃的日志数据条数。 failed:从源日志单元中读取,在加工过程中发生失败的数据条数。 读取日志数统计:从源日志单元读取到的数据条数总计,默认时间周期为1小时。 写出日志数统计:成功写入到所有目标日志单元的数据条数总计,默认时间周期为1小时。 失败日志数统计:从源日志单元中读取、并在加工过程中发生失败的数据条数总计,默认时间周期为1小时。 写出日志数占比:成功投递到目标日志单元的数据条数占源日志单元读取到数据条数的比例,默认时间周期为1小时。
        来自:
        帮助文档
        云日志服务
        用户指南
        数据加工
        观测与监控数据加工任务
      • 查询审计事件
        本节介绍如何在云审计服务管理控制台查看或导出最近7天的操作记录。 操作场景 用户进入云审计服务创建管理类追踪器后,系统开始记录云服务资源的操作。在创建数据类追踪器后,系统开始记录用户对OBS桶中数据的操作。云审计服务管理控制台会保存最近7天的操作记录。 在事件列表查看审计事件 1. 登录管理控制台。 2. 单击页面左上角的“服务列表”,选择“管理与部署 > 云审计服务”,进入云审计服务页面。 3. 单击左侧导航栏的“事件列表”,进入事件列表信息页面。 4. 事件列表支持通过筛选来查询对应的操作事件。当前事件列表支持四个维度的组合查询,详细信息如下: 事件类型、事件来源、资源类型和筛选类型,在下拉框中选择查询条件。 筛选类型按资源ID筛选时,还需手动输入某个具体的资源ID。 筛选类型按事件名称筛选时,还需选择某个具体的事件名称。 筛选类型按资源名称筛选时,还需选择或手动输入某个具体的资源名称。 操作用户:在下拉框中选择某一具体的操作用户,此操作用户指用户级别,而非租户级别。 事件级别:可选项为“所有事件级别”、“Normal”、“Warning”、“Incident”,只可选择其中一项。 时间范围:可选择查询最近7天内任意时间段的操作事件。 单击“导出”按钮,云审计服务会将查询结果以CSV格式的表格文件导出,该CSV文件包含了本次查询结果的所有事件,且最多导出5000条信息。 5. 选择完查询条件后,单击“查询”。 6. 在事件列表页面,您还可以导出操作记录文件和刷新列表。 单击“导出”按钮,云审计服务会将查询结果以CSV格式的表格文件导出,该CSV文件包含了本次查询结果的所有事件,且最多导出5000条信息。 单击“刷新”按钮,可以获取到事件操作记录的最新信息。 7. 在需要查看的事件左侧,单击“展开”图标,展开该记录的详细信息。 8. 在需要查看的记录右侧,单击“查看事件”,会弹出一个窗口显示该操作事件结构的详细信息。 9. 关于事件结构的关键字段详解,请参见事件结构和事件样例。
        来自:
        帮助文档
        Web应用防火墙(独享版)
        监控与审计
        审计
        查询审计事件
      • 告警历史
        本页介绍了文档数据库服务的告警历史。 文档数据库服务支持查看实例的历史告警数据。 查看告警历史 登录TeleDB数据库控制台。 点击“告警中心”>“告警历史”目录,可以在页面上方选择查看历史告警的时间范围。 选择具体告警,在“操作”列点击“查看详情”按钮,可以查看历史告警详情信息。
        来自:
        帮助文档
        文档数据库服务
        用户指南
        监控管理
        告警历史
      • 查看事件
        本章节主要介绍数据仓库如何查看事件。 介绍用户如何查找集群或快照发生的事件。 1.登录DWS 管理控制台。 2.在左侧导航树,单击“事件管理”,进入“事件”页面。 在事件列表中,默认显示当前所有集群或快照已发生的事件。 在表头的字段名称“时间”旁,单击,可以将事件按时间的顺序或倒叙进行排列。 在表头的字段(除“时间”以外)名称旁,单击,并在弹出菜单中选择相应字段的过滤条件,可以对事件进行筛选。
        来自:
        帮助文档
        数据仓库服务
        用户指南
        监控与告警
        事件通知
        查看事件
      • 消息管理
        本文介绍消息管理功能的使用方式。 使用说明 1. 登录ECX控制台。 2. 在左侧栏找到【服务管理>消息管理】并点击进入。 3. 消息管理版块可以配置接收消息的邮箱、安全验证方式、消息接收组。 邮箱 点击【邮箱】,可以查看注册邮箱、默认的消息通知都将发送到注册邮箱中,如果您的天翼云账号不是以邮箱注册的,可以在【天翼云官网>我的>账号中心>基本信息、安全设置】版块,绑定一个邮箱。 安全验证 点击【安全验证】,可以设置敏感操作保护,开启后,进行敏感操作时,将需要进行安全验证。 消息接收组 点击【消息接收组】,可以查看、创建、管理消息接收组,一个消息接收组中支持配置企业微信机器人地址、钉钉订阅地址、多个邮箱及手机号,用于接收告警消息。所有接收组中的手机号,共享短信通知配额。
        来自:
        帮助文档
        智能边缘云
        运维与监控
        消息管理
      • 云硬盘EVS支持的事件列表
        事件名称 事件ID 事件级别 事件说明 处理建议 事件影响 更新磁盘 updateVolume 次要 更新一个云硬盘的名称和描述。 无需处理。 无。 扩容磁盘 extendVolume 次要 对云硬盘进行扩容。 无需处理。 无。 删除磁盘 deleteVolume 重要 删除一个云硬盘。 无需处理。 删除的磁盘将不能被恢复。 磁盘性能达到QoS上限 reachQoS 重要 磁盘性能频繁达到该规格的QoS上限,从而触发流控,导致IO访问时延变大。 建议提升磁盘规格。 IO访问时延变大
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        云硬盘EVS支持的事件列表
      • 秘钥管理服务KMS支持的事件列表
        事件名称 事件ID 事件级别 禁用密钥 disableKey 重要 计划删除密钥 scheduleKeyDeletion 次要 退役授权 retireGrant 重要 撤销授权 revokeGrant 重要
        来自:
        帮助文档
        云监控服务
        用户指南
        事件监控
        事件监控支持的事件说明
        秘钥管理服务KMS支持的事件列表
      • 1
      • 2
      • ...
      • 116
      • 117
      • 118
      • 119
      • 120
      • 121
      跳转至
      推荐热词
      天翼云运维管理审计系统天翼云云服务平台云服务备份云日志服务应用运维管理云手机云电脑天翼云云hbase数据库电信云大数据saas服务电信云大数据paas服务轻量型云主机天翼云客户服务电话应用编排服务天翼云云安全解决方案云服务总线CSB天翼云服务器配置天翼云联邦学习产品天翼云云安全天翼云企业上云解决方案天翼云产品天翼云视频云存储

      天翼云最新活动

      安全隔离版OpenClaw

      OpenClaw云服务器专属“龙虾“套餐低至1.5折起

      天翼云新春焕新季

      云主机开年特惠28.8元/年,0元秒杀等你来抢!

      云上钜惠

      爆款云主机全场特惠,2核4G只要1.8折起!

      中小企业服务商合作专区

      国家云助力中小企业腾飞,高额上云补贴重磅上线

      出海产品促销专区

      爆款云主机低至2折,高性价比,不限新老速来抢购!

      天翼云奖励推广计划

      加入成为云推官,推荐新用户注册下单得现金奖励

      产品推荐

      弹性云主机 ECS

      物理机 DPS

      多活容灾服务

      镜像服务 IMS

      弹性高性能计算 E-HPC

      模型推理服务

      科研助手

      一站式智算服务平台

      知识库问答

      推荐文档

      MySQL

      手动切换主备实例

      常见问题

      • 7*24小时售后
      • 无忧退款
      • 免费备案
      • 专家服务
      售前咨询热线
      400-810-9889转1
      关注天翼云
      • 旗舰店
      • 天翼云APP
      • 天翼云微信公众号
      服务与支持
      • 备案中心
      • 售前咨询
      • 智能客服
      • 自助服务
      • 工单管理
      • 客户公告
      • 涉诈举报
      账户管理
      • 管理中心
      • 订单管理
      • 余额管理
      • 发票管理
      • 充值汇款
      • 续费管理
      快速入口
      • 天翼云旗舰店
      • 文档中心
      • 最新活动
      • 免费试用
      • 信任中心
      • 天翼云学堂
      云网生态
      • 甄选商城
      • 渠道合作
      • 云市场合作
      了解天翼云
      • 关于天翼云
      • 天翼云APP
      • 服务案例
      • 新闻资讯
      • 联系我们
      热门产品
      • 云电脑
      • 弹性云主机
      • 云电脑政企版
      • 天翼云手机
      • 云数据库
      • 对象存储
      • 云硬盘
      • Web应用防火墙
      • 服务器安全卫士
      • CDN加速
      热门推荐
      • 云服务备份
      • 边缘安全加速平台
      • 全站加速
      • 安全加速
      • 云服务器
      • 云主机
      • 智能边缘云
      • 应用编排服务
      • 微服务引擎
      • 共享流量包
      更多推荐
      • web应用防火墙
      • 密钥管理
      • 等保咨询
      • 安全专区
      • 应用运维管理
      • 云日志服务
      • 文档数据库服务
      • 云搜索服务
      • 数据湖探索
      • 数据仓库服务
      友情链接
      • 中国电信集团
      • 天翼云国际站
      • 189邮箱
      • 天翼企业云盘
      • 天翼云盘
      ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
      公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
      • 用户协议
      • 隐私政策
      • 个人信息保护
      • 法律声明
      备案 京公网安备11010802043424号 京ICP备 2021034386号