活动

天翼云最新优惠活动,涵盖免费试用,产品折扣等,助您降本增效!
热门活动
  • 驭马迎春·福礼抢先领 5.5折无门槛折扣券+开箱即用方案双加持,节后上云快人一步!
  • 云上钜惠 爆款云主机全场特惠,2核4G只要1.8折起!
  • 中小企业服务商合作专区 国家云助力中小企业腾飞,高额上云补贴重磅上线
  • 出海产品促销专区 NEW 爆款云主机低至2折,高性价比,不限新老速来抢购!
  • 天翼云奖励推广计划 加入成为云推官,推荐新用户注册下单得现金奖励
免费活动
  • 免费试用中心 HOT 多款云产品免费试用,快来开启云上之旅
  • 天翼云用户体验官 NEW 您的洞察,重塑科技边界

息壤智算

领先开放的智算服务平台,提供算力、平台、数据、模型、应用“五位一体”智算服务体系,构建全流程的AI基础设施能力
AI Store
  • 算力市场
  • 模型市场
  • 应用市场
  • MCP市场
算力互联调度平台
  • 裸金属
  • 定制裸金属
训推服务
  • 模型开发
  • 训练任务
  • 服务部署
模型推理服务
  • 模型广场
  • 体验中心
  • 服务接入
应用托管
  • 应用实例
科研助手
  • 科研智能体
  • 科研服务
  • 开发机
  • 并行计算
大模型
  • DeepSeek-V3.1
  • DeepSeek-R1-0528
  • DeepSeek-V3-0324
  • Qwen3-235B-A22B
  • Qwen3-32B
智算一体机
  • 智算一体机
模型适配专家服务
  • 模型适配专家服务
算力服务商
  • 入驻算力服务商

应用商城

天翼云精选行业优秀合作伙伴及千余款商品,提供一站式云上应用服务
进入甄选商城进入云市场进入AI Store创新解决方案公有云生态专区智云上海应用生态专区
建站工具
  • 新域名服务
  • SSL证书
  • 翼建站
企业办公
  • 安全邮箱
  • WPS 365 天翼云版
  • 天翼企业云盘(标准服务版)
灾备迁移
  • 云管家2.0
  • 翼备份(SaaS版)

定价

协助您快速了解云产品计费模式、价格详情,轻松预估上云成本
价格计算器
  • 动态测算产品价格
定价策略
  • 快速了解计费模式

合作伙伴

天翼云携手合作伙伴,共创云上生态,合作共赢
天翼云生态合作中心
  • 天翼云生态合作中心
天翼云渠道合作伙伴
  • 天翼云代理渠道合作伙伴
天翼云服务合作伙伴
  • 天翼云集成商交付能力认证
天翼云应用合作伙伴
  • 天翼云云市场合作伙伴
  • 天翼云甄选商城合作伙伴
天翼云技术合作伙伴
  • 天翼云OpenAPI中心
天翼云培训认证
  • 天翼云学堂
  • 天翼云市场商学院
天翼云合作计划
  • 云汇计划
天翼信创云专区
  • 信创云专区
  • 适配互认证

开发者

开发者相关功能入口汇聚
技术社区
  • 专栏文章
  • 互动问答
  • 技术视频
资源与工具
  • OpenAPI中心
培训与认证
  • 天翼云学堂
  • 天翼云认证
开源社区
  • 魔乐社区
  • OpenTeleDB

支持与服务

为您提供全方位支持与服务,全流程技术保障,助您轻松上云,安全无忧
文档与工具
  • 文档中心
  • 新手上云
  • 自助服务
  • OpenAPI中心
定价
  • 价格计算器
  • 定价策略
基础服务
  • 售前咨询
  • 在线支持
  • 在线支持
  • 工单服务
  • 服务保障
  • 会员中心
增值服务
  • 红心服务
  • 首保服务
  • 客户支持计划
  • 专家技术服务
  • 备案管家
我要反馈
  • 建议与反馈
  • 用户体验官
信息公告
  • 客户公告

了解天翼云

天翼云秉承央企使命,致力于成为数字经济主力军,投身科技强国伟大事业,为用户提供安全、普惠云服务
品牌介绍
  • 关于天翼云
  • 智算云
  • 天翼云4.0
  • 新闻资讯
  • 天翼云APP
基础设施
  • 全球基础设施
  • 信任中心
最佳实践
  • 精选案例
  • 超级探访
  • 云杂志
  • 分析师和白皮书
  • 天翼云·创新直播间
市场活动
  • 2025智能云生态大会
  • 2024智算云生态大会
  • 2023云生态大会
  • 2022云生态大会
  • 天翼云中国行
天翼云
  • 活动
  • 息壤智算
  • 产品
  • 解决方案
  • 应用商城
  • 定价
  • 合作伙伴
  • 开发者
  • 支持与服务
  • 了解天翼云
      • 文档
      • 控制中心
      • 备案
      • 管理中心
      文档中心

      应用高可用

      应用高可用

      • 应用高可用

      无数据

        • 产品动态
        • 产品简介
        • 产品定义
        • 应用容灾多活
        • 产品定义
        • 产品优势
        • 产品架构
        • 应用场景
        • 名词解释
        • 使用限制
        • 故障演练服务
        • 产品定义
        • 产品优势
        • 应用场景
        • 名词解释
        • 购买指南
        • 应用容灾多活计费说明
        • 计费说明
        • 支持的功能模块
        • 欠费与退订说明
        • 快速入门
        • 快速接入应用容灾多活
        • 进行故障演练实验
        • 用户指南
        • 应用容灾多活
        • 应用管理
        • 应用系统
        • 模块开通
        • 架构管理
        • 单元配置
        • 路由配置
        • 资源管理
        • 配置总览
        • 接入层配置
        • 数据层配置
        • 消息层配置
        • 服务层配置
        • 多活容灾
        • 基线推送
        • 多活切流
        • 运维监控
        • 架构地图
        • 操作日志
        • 日常巡检
        • 权限管理
        • 服务内联委托
        • 故障演练服务
        • 环境管理
        • 应用管理
        • 应用配置
        • 应用资源
        • 监控指标
        • 探针管理
        • 云主机探针管理
        • 云容器探针管理
        • 创建VPC终端节点
        • 演练管理
        • 演练任务
        • 执行演练
        • 故障动作库
        • 计算
        • 弹性云主机
        • 云主机宕机
        • 云主机CPU高负载
        • 云主机内存高负载
        • 云主机磁盘IO高负载
        • 云主机磁盘IO Hang
        • 云主机磁盘填充
        • 云主机网络丢包
        • 云主机网络延迟
        • 云主机网络包重复
        • 云主机网络包乱序
        • 云主机网络包损坏
        • 云主机端口占用
        • 云主机DNS篡改
        • 云主机DNS不可用
        • 云主机JVM延迟
        • 中间件
        • 分布式消息服务Kafka
        • Kafka Broker节点CPU高负载
        • Kafka Broker节点磁盘IO高负载
        • Kafka Broker节点主机宕机
        • Kafka Broker分区Leader不可用
        • 注册配置中心RCC
        • RCC停止服务
        • RCC停止节点
        • 云容器
        • 云容器引擎
        • 云容器托管Master节点宕机
        • 云容器ETCD集群节点故障
        • 云容器集群节点宕机
        • 云容器集群节点CPU高负载
        • 云容器集群节点内存高负载
        • 云容器集群节点磁盘IO高负载
        • 云容器集群节点磁盘填充
        • 云容器集群节点网络丢包
        • 云容器集群节点网络延迟
        • 云容器集群节点网络包重复
        • 云容器集群节点网络包乱序
        • 云容器集群节点网络包损坏
        • 云容器集群节点DNS篡改
        • 云容器集群节点进程挂起
        • 云容器集群节点进程终止
        • 云容器集群Pod CPU高负载
        • 云容器集群Pod内存高负载
        • 云容器集群Pod磁盘IO高负载
        • 云容器集群Pod磁盘填充
        • 云容器集群Pod网络丢包
        • 云容器集群Pod网络延迟
        • 云容器集群Pod网络包重复
        • 云容器集群Pod网络包乱序
        • 云容器集群Pod网络包损坏
        • 云容器集群Pod DNS篡改
        • 云容器集群Pod删除
        • 云容器集群Pod进程挂起
        • 云容器集群Pod进程停止
        • 云容器集群Pod Java方法调用延迟
        • 云容器集群Pod Java方法抛自定义异常
        • 容器镜像服务
        • Harbor服务不可用
        • 数据库
        • 分布式缓存服务Redis版
        • Redis主从切换
        • Redis节点故障
        • Proxy节点故障
        • Redis节点主机宕机
        • Redis节点CPU高负载
        • Redis节点内存高负载
        • Redis节点磁盘IO高负载
        • Redis节点磁盘IO Hang
        • Redis节点网络丢包
        • 权限管理
        • 服务内联委托
        • 最佳实践
        • 应用容灾多活
        • 应用双活接入示例
        • 业务单元化双活实践
        • 故障演练服务
        • Kafka Broker节点CPU高负载故障演练实战
        • 常见问题
        • 应用容灾多活
        • 产品类
        • 技术类
        • 功能类
        • 故障演练服务
        • 产品类
        • 技术类
        • 功能类
        • 相关协议
        • 服务协议
          无相关产品

          本页目录

          帮助中心应用高可用快速入门进行故障演练实验
          进行故障演练实验
          更新时间 2026-02-11 10:45:59
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          最近更新时间: 2026-02-11 10:45:59
          分享文章
          • 新浪微博
          • 微信
            扫码分享
          • 复制链接
          本章节介绍介绍如何进行一次完整的故障演练实验,帮助您快速上手产品使用。

          故障演练服务的使用过程遵循创建应用-纳管资源-执行演练-观测结果的基本流程。

          下面以分布式缓存服务Redis版实例的CPU高负载场景为例,介绍如何进行一次完整的故障演练实验。

          一、创建环境

          登录应用高可用控制台,进入故障演练服务,打开环境概览页面,单击创建环境,根据页面提示完成环境创建。

          二、创建应用

          打开应用列表页面,单击创建应用。

          三、添加资源

          打开应用资源页面,在资源类型页签中选择分布式缓存服务Redis版,然后单击添加资源。在弹出的对话框中选择目标实例,单击确定即可完成资源添加。

          四、添加监控指标

          打开监控指标页面,选择云产品监控页签,单击添加指标。在对话框中选择分布式缓存服务Redis版,然后选择节点指标下的主机CPU使用率,单击确定将选定的指标添加到当前应用。

          五、创建演练任务

          打开演练管理页面,单击新建演练。

          1. 填写基本信息

          进入基本信息填写页面,填写演练名称、演练描述和关联应用等。

          说明

          • 配置关联应用可在当前演练任务中选择关联应用的资源进行故障演练。

          2. 配置演练对象

          单击下一步,进入演练对象配置页面,进行动作组配置,并添加故障动作。

          • 添加实例
            在动作组中选择资源类型为分布式缓存服务Redis版,单击添加实例,选择期望进行故障演练的资源。

          说明

          • 一个动作组内不同资源类型可选择的实例个数有不同的限制,分布式缓存服务Redis版在一个动作组内仅支持选择一个实例。
          • 配置动作
            单击动作列表中的立即添加,在列表中选择CPU高负载故障动作,并进行参数配置。

          说明

          • 同一个动作组内仅可针对同一资源类型进行故障注入操作。

          3. 进行全局配置

          单击下一步,进入全局配置页面,进行监控指标和演练超时时间等配置。

          说明

          • 一个演练中,每个应用需要分别添加期望观察的监控指标。

          六、执行演练

          1. 打开演练管理页面,找到目标演练任务,单击执行演练。

          2. 进入执行记录页面,单击发起新演练。

          3. 在新发起的演练记录上单击详情,进入演练运行详情页面。

          4. 在详情页面的演练动作组中,找到CPU高负载故障动作卡片,单击执行。

          5. 点击CPU高负载故障动作卡片,可以查看动作参数和执行详情。

          6. 进行故障恢复时,在动作组中选择带有恢复标记的卡片,并单击执行。

          说明

          • 环境检测:发起演练时,系统会对所有演练资源进行故障注入依赖检查,可在导航栏查看所有动作组资源的检查情况,也可在各个动作组的环境预检测结果处查看指定动作组的资源检查情况。环境检测不通过仍然可以执行演练,只是在演练过程中可能会有部分故障动作执行失败,由业务自行抉择。

          • 保护策略:发起演练时,系统自动为当前演练创建一个超时保护策略,实验未结束且持续超过设置的时间后,会自动结束演练并回滚已经注入的故障。

          七、结束演练

          1. 在演练运行详情页面,单击导航栏的结束演练按钮,结束当前演练。

          2. 单击导航栏的演练结论按钮,填写实验总结信息。

          说明

          • 结束演练时,系统会自动恢复所有尚未恢复的故障动作。恢复过程是异步操作,可以在界面观察恢复状态,待所有动作均恢复完成后,即可最终完成本次实验。


           

          文档反馈

          建议您登录后反馈,可在建议与反馈里查看问题处理进度

          鼠标选中文档,精准反馈问题

          选中存在疑惑的内容,即可快速反馈问题,我们会跟进处理

          知道了

          上一篇 :  快速接入应用容灾多活
          下一篇 :  用户指南
          搜索 关闭
          ©2026 天翼云科技有限公司版权所有 增值电信业务经营许可证A2.B1.B2-20090001
          公司地址:北京市东城区青龙胡同甲1号、3号2幢2层205-32室
          备案 京公网安备11010802043424号 京ICP备 2021034386号
          ©2026天翼云科技有限公司版权所有
          京ICP备 2021034386号
          备案 京公网安备11010802043424号
          增值电信业务经营许可证A2.B1.B2-20090001
          用户协议 隐私政策 法律声明