Pod状态为Evicted 问题现象:Pod的状态为Evicted。 问题原因:当节点的内存、磁盘空间、文件系统的inode和操作系统可分配的PID等资源中的一个或者多个达到特定的消耗水平,节点的kubelet进程就会主动地驱逐一到多个Pod,以回收节点资源。 解决方案: 1、执行以下命令,查看Pod的status.message字段,来确定Pod被驱逐的原因。 kubectl get pod o yaml n 2、执行以下命令,删除被驱逐的Pod。 kubectl get pods n grep Evicted awk '{print $1}' xargs kubectl delete pod n Pod OOM异常问题处理 问题现象:容器异常重启,并重启次数较多 问题原因:Pod使用超过其限制的内存 解决方案: 1、确定发生OOM异常的Pod所在的节点 2、登录Pod所在的Node,查看系统日志文件/var/log/message,搜索out of memory关键字,确认具体被OOM终止时间点和进程名称 3、根据Pod的内存监控数据,排查Pod内应用进程否存在内存泄漏。若应用进程存在内存泄漏导致需客户自行修正程序漏洞。若进程运行状态正常,则根据实际运行需要,适当增大Pod的内存限制