故障诊断概述 本节介绍了故障诊断的用户指南,云容器引擎提供一键故障诊断能力,包括Service诊断、节点诊断、Pod诊断、Ingress诊断,辅助定位集群中出现的异常问题。 前提条件 已创建容器集群,具体操作请参见 用户指南 > 集群 > 新建集群 。 确保集群运行状态处于运行中。 故障诊断功能介绍 云容器引擎提供的故障诊断功能如下表所示: 诊断项 说明 Service诊断 诊断Service相关问题,例如Service后端就绪Pod、异常事件信息等。 节点诊断 诊断节点相关问题,例如K8s节点NotReady等。 Pod诊断 诊断K8s Pod状态异常相关的问题,例如Pod启动失败、Pod频繁重启等 。 Ingress诊断 诊断Ingress相关流量配置问题。 配置故障诊断 注意 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、kubelet等运行状态以及系统日志中的关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。 配置Service、节点、Pod、Ingress等诊断操作类似。下文以配置节点诊断为例,介绍如何配置故障诊断功能。 1. 登陆云容器引擎控制台, 点击左侧导航栏中的集群,进入集群列表页。 2. 在集群列表中点击需要配置故障诊断的集群,进入集群管理页面。 3. 在集群管理页面导航栏中选择运维管理 > 故障诊断,进入故障诊断页面。 4. 在故障诊断页面,点击节点诊断Tab页面,在选择节点面板,选择需要诊断的节点名称,点击确定按钮发起诊断。 在诊断列表页面可查看诊断进展。诊断完成后,诊断页面将显示诊断结果。