CCE节点故障检测 默认情况下,若多个节点发生故障,NPC只会为1个节点添加污点,可通过参数npc. maxTaintedNode提高数量限制。故障恢复时,NPC不在运行状态,污点会残留,需要手动清理或启动NPC。 开源NPD插件提供了故障探测能力,但未提供基础故障隔离能力。对此,CCE在开源NPD的基础上,增强了Node-problem-controller(节点故障控制器组件),该组件参照kubernetes节点控制器实现,针对NPD探测上报的故障,自动为节点添加污点以进行基本的节点故障隔离。