活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 驭马迎春·福礼抢先领 5.5折无门槛折扣券+开箱即用方案双加持,节后上云快人一步!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
算力互联调度平台
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      应用高可用

      应用高可用

      • 应用高可用

      无数据

        • 产品动态
        • 产品简介
        • 产品定义
        • 应用容灾多活
        • 产品定义
        • 产品优势
        • 产品架构
        • 应用场景
        • 名词解释
        • 使用限制
        • 故障演练服务
        • 产品定义
        • 产品优势
        • 应用场景
        • 名词解释
        • 购买指南
        • 应用容灾多活计费说明
        • 计费说明
        • 支持的功能模块
        • 欠费与退订说明
        • 快速入门
        • 快速接入应用容灾多活
        • 进行故障演练实验
        • 用户指南
        • 应用容灾多活
        • 应用管理
        • 应用系统
        • 模块开通
        • 架构管理
        • 单元配置
        • 路由配置
        • 资源管理
        • 配置总览
        • 接入层配置
        • 数据层配置
        • 消息层配置
        • 服务层配置
        • 多活容灾
        • 基线推送
        • 多活切流
        • 运维监控
        • 架构地图
        • 操作日志
        • 日常巡检
        • 权限管理
        • 服务内联委托
        • 故障演练服务
        • 环境管理
        • 应用管理
        • 应用配置
        • 应用资源
        • 监控指标
        • 探针管理
        • 云主机探针管理
        • 云容器探针管理
        • 创建VPC终端节点
        • 演练管理
        • 演练任务
        • 执行演练
        • 故障动作库
        • 计算
        • 弹性云主机
        • 云主机宕机
        • 云主机CPU高负载
        • 云主机内存高负载
        • 云主机磁盘IO高负载
        • 云主机磁盘IO Hang
        • 云主机磁盘填充
        • 云主机网络丢包
        • 云主机网络延迟
        • 云主机网络包重复
        • 云主机网络包乱序
        • 云主机网络包损坏
        • 云主机端口占用
        • 云主机DNS篡改
        • 云主机DNS不可用
        • 云主机JVM延迟
        • 中间件
        • 分布式消息服务Kafka
        • Kafka Broker节点CPU高负载
        • Kafka Broker节点磁盘IO高负载
        • Kafka Broker节点主机宕机
        • Kafka Broker分区Leader不可用
        • 注册配置中心RCC
        • RCC停止服务
        • RCC停止节点
        • 云容器
        • 云容器引擎
        • 云容器托管Master节点宕机
        • 云容器ETCD集群节点故障
        • 云容器集群节点宕机
        • 云容器集群节点CPU高负载
        • 云容器集群节点内存高负载
        • 云容器集群节点磁盘IO高负载
        • 云容器集群节点磁盘填充
        • 云容器集群节点网络丢包
        • 云容器集群节点网络延迟
        • 云容器集群节点网络包重复
        • 云容器集群节点网络包乱序
        • 云容器集群节点网络包损坏
        • 云容器集群节点DNS篡改
        • 云容器集群节点进程挂起
        • 云容器集群节点进程终止
        • 云容器集群Pod CPU高负载
        • 云容器集群Pod内存高负载
        • 云容器集群Pod磁盘IO高负载
        • 云容器集群Pod磁盘填充
        • 云容器集群Pod网络丢包
        • 云容器集群Pod网络延迟
        • 云容器集群Pod网络包重复
        • 云容器集群Pod网络包乱序
        • 云容器集群Pod网络包损坏
        • 云容器集群Pod DNS篡改
        • 云容器集群Pod删除
        • 云容器集群Pod进程挂起
        • 云容器集群Pod进程停止
        • 云容器集群Pod Java方法调用延迟
        • 云容器集群Pod Java方法抛自定义异常
        • 容器镜像服务
        • Harbor服务不可用
        • 数据库
        • 分布式缓存服务Redis版
        • Redis主从切换
        • Redis节点故障
        • Proxy节点故障
        • Redis节点主机宕机
        • Redis节点CPU高负载
        • Redis节点内存高负载
        • Redis节点磁盘IO高负载
        • Redis节点磁盘IO Hang
        • Redis节点网络丢包
        • 权限管理
        • 服务内联委托
        • 最佳实践
        • 应用容灾多活
        • 应用双活接入示例
        • 业务单元化双活实践
        • 故障演练服务
        • Kafka Broker节点CPU高负载故障演练实战
        • 常见问题
        • 应用容灾多活
        • 产品类
        • 技术类
        • 功能类
        • 故障演练服务
        • 产品类
        • 技术类
        • 功能类
        • 相关协议
        • 服务协议
          无相关产品

          本页目录

          帮助中心应用高可用常见问题故障演练服务功能类
          功能类
          更新时间 2026-02-11 10:46:44
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2026-02-11 10:46:44
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节主要介绍故障演练服务功能类问题。

          如何查看故障注入的详细日志?

          可以在两个层级查看日志,以了解不同的执行细节:

          演练实验级别:

          1. 导航至 演练管理 > 执行记录 > 详情 页面。

          2. 在页面右上角,单击演练日志,可以查看本次演练的总体流程和高级别事件。

          具体动作级别:

          1. 在演练运行详情页的动作列表中,单击具体的故障动作卡片(无论是注入还是恢复)。

          2. 在右侧弹出的侧边栏中,单击查看日志,可以获取该动作最详细的执行日志。

          动作组、并行动作、动作之间的关系?

          它们构成了一个清晰的层级关系,用于编排从简单到复杂的各种演练场景:

          • 动作组:
            场景级的容器。一个动作组代表一个完整的故障场景,例如“模拟数据中心A网络故障”。它可以包含多个并行的动作,并且可以针对不同类型的资源进行编排(如同时对Redis和云主机注入故障)。在一个演练任务中,不同的动作组之间是并行执行的。

          • 并行动作:
            并发执行的单元。在一个动作组内部,可以创建多个并行动作块。这些块之间是并行执行的,用于模拟同时发生的多个故障。

          • 动作:
            最小的执行单元。它代表一个具体的故障动作(如CPU高负载、网络延迟)。在一个并行动作块内部,可以添加多个动作,它们之间是串行执行的,用于模拟一个有先后顺序的故障链条。

          多个演练实验可以同时执行吗?

          • 同一应用下:不可以。为了避免相互干扰和结果混淆,同一应用下,在任意时刻只能执行一个演练任务。因此,必须等待上一个演练任务结束后,才能发起新的演练。

          • 不同应用下:可以。不同应用下的演练任务相互独立,可以同时执行。

          演练实验会自动停止吗?

          会。每个演练任务在创建时都会配置一个“演练超时时间”,这是一个内置的超时保护机制。

          当演练运行时长达到该阈值时,故障演练服务会自动触发演练的停止和故障恢复流程。当然,用户可以随时在演练运行详情页手动结束演练。

          为什么手动结束演练,但演练没有立即停止?

          因为系统正在执行必要的“清理和恢复”工作。

          点击“结束演练”后,系统会立即开始自动恢复所有已注入的故障。这是一个异步过程,在所有故障都成功恢复之前,演练状态不会变为“已结束”。

          可以在演练运行详情页顶部的状态栏中观察演练所处的环节,当“演练结论”环节亮起时,才表明演练已完全结束。

          故障注入失败怎么办?

          1. 在演练运行详情页,单击失败的故障动作卡片,在右侧弹出的侧边栏中查看日志,了解失败的具体原因。

          2. 根据日志提示进行排查和处理(例如,检查探针状态、网络连通性或权限)。

          3. 处理完毕后,可以对该动作节点单击重试,尝试重新注入故障。

          4. 如果确认不具备故障注入的条件,注入失败未产生实际影响,可忽略该动作。

          故障恢复失败怎么办?

          1. 检查日志:与注入失败类似,先通过查看日志了解恢复失败的原因。

          2. 平台重试:单击重试按钮,尝试让平台再次自动恢复。

          3. 手动恢复:如果平台重试无效,您需要根据故障类型进行手动恢复。例如:

            • 对于主机宕机,请到云主机控制台对机器执行重启操作。

            • 对于DNS篡改,请登录到云主机手动编辑并还原 /etc/hosts 文件。

            • 对于大多数组件故障,在对应云产品控制台对实例执行重启通常是有效的恢复手段。

          4. 确认跳过:如果确认通过手动方式恢复了故障,且业务已恢复正常,可以回到故障演练控制台,对该恢复节点单击跳过按钮,系统将忽略该故障动作的恢复结果,继续推进演练流程。请务必谨慎使用此功能。

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  技术类
          下一篇 :  相关协议
          搜索 关闭
          ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2026天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明