云容器托管Master节点宕机(1) 本章节介绍云容器引擎托管Master节点宕机故障演练。 背景介绍 云容器引擎(CCE)Master节点是集群控制核心,负责容器调度、资源管理等关键职责,硬件故障、系统异常、软件故障及网络中断等均可能导致其异常。Master节点宕机可能会造成集群调度失效、管控异常,波及上层业务,本演练可测试系统应对与恢复能力,提升集群及业务高可用性。 基本原理 通过关闭云容器引擎Master节点主机,模拟Master节点宕机(支持托管版本和智算版)。 故障注入 1、纳管实例资源 1. 导航至 故障演练 > 目标应用 > 应用资源页面。 2. 在资源类型页签中选择云容器引擎,然后单击添加资源。 3. 在弹出的对话框中,勾选目标云容器引擎实例,单击确定。 2、编排演练任务 1. 导航至 故障演练 > 目标应用 > 演练管理 页面,单击新建演练。 2. 在基本信息 页面,按提示填写演练名称和描述,然后单击下一步。 3. 在演练对象配置页面: 配置动作组 :为动作组 命名,资源类型选择云容器引擎。 添加实例 :单击添加实例 ,勾选上一步中添加的云容器引擎实例。 添加故障动作 :单击立即添加 ,在列表中选择托管Master节点宕机动作。 4. 在弹出的参数配置框中,配置所需参数,然后单击确定。 持续时间:故障动作持续时间。 Master节点:故障动作的目标节点。
来自: