工作负载类 排查项三:带云硬盘卷的Deployment的副本数大于1 问题描述: 创建Pod失败,并报“添加存储失败”的事件,事件信息如下。 MultiAttach error for volume "pvc62a7a7d99dc842a283660f5ef9db5b60" Volume is already used by pod(s) testttt7b774658cblc98h 问题定位: 查看Deployment的副本数是否大于1。 Deployment中使用EVS存储卷时,副本数只能为1。若用户在后台指定Deployment的实例数为2以上,此时CCE并不会限制Deployment的创建。但若这些实例Pod被调度到不同的节点,则会有部分Pod因为其要使用的EVS无法被挂载到节点,导致Pod无法启动成功。 解决方案: 使用EVS的Deployment的副本数指定为1,或使用其他类型存储卷。 排查项四:EVS磁盘文件系统损坏 问题描述: 创建Pod失败,出现类似信息,磁盘文件系统损坏。 MountVolume.MountDevice failed for volume "pvc08178474c58c4820a82814437d46ba6f" : rpc error: code Internal desc [09060defafd011ec9664fa163eef47d0] /dev/sda has file system, but it is detected to be damaged 解决方案: 在EVS中对磁盘进行备份,然后执行如下命令修复文件系统。 fsck y {盘符} 七、工作负载异常:一直处于创建中 问题描述 节点变更之后,节点上的工作负载一直处于创建中。 解决方法 步骤 1 登录CCE节点(弹性云服务器)并删除cpumanagerstate文件。 删除命令示例如下: rm rf /mnt/paas/kubernetes/kubelet/cpumanagerstate 步骤 2 重启节点或重启kubelet,重启kubelet的方法如下: systemctl restart kubelet 此时重新拉起或创建工作负载,已可成功执行。 解决方式链接:CCE节点变更规格后,为什么无法重新拉起或创建工作负载? 八、工作负载异常:结束中,解决Terminating状态的Pod删不掉的问题
来自: