名词解释
更新时间 2026-02-11 10:45:49
最近更新时间: 2026-02-11 10:45:49
本章节介绍故障演练服务的基本名词概念,以帮助您更好地理解和使用本产品。
故障演练服务术语
| 名词 | 说明 |
|---|---|
| 环境 | 用于隔离不同应用的逻辑单元。 |
| 应用 | 一组资源的逻辑集合,通常代表一个业务系统。应用是进行演练和管理的核心对象。 |
| 资源 | 构成应用的组件节点,例如云主机、容器、分布式缓存服务Redis版、分布式消息服务Kafka等实例。 |
| 演练 | 通过向应用的特定资源注入指定故障,并观察其影响,从而验证系统稳定性与韧性的过程。 |
| 动作 | 注入到目标资源上的一个原子性故障,例如“CPU高负载”或“网络延迟”。用户可以在一次演练中对多个动作进行自由组合和编排。 |
| 动作组 | 一个或多个动作的逻辑分组,通常代表一个完整的故障场景。在一个演练任务中,不同的动作组之间可以并行执行。 |
| 探针 | 安装在目标资源(如云主机)上,用于执行具体故障注入动作的代理程序(Agent)。 |
| 保护策略 | 一种自动化的安全机制,用于控制演练的“爆炸半径”。当触发预设条件时,系统会依据此策略自动中止演练并回滚故障。 |