ubuntu

Ubuntu Kubernetes故障排查方法有哪些

小樊
41
2025-11-17 00:14:25
栏目: 智能运维

Ubuntu 上 Kubernetes 故障排查方法

一 基础状态与组件检查

二 Pod 与容器故障定位

三 Service 与网络连通性排查

四 节点级与系统层问题

五 高频场景速查表

症状 优先命令 重点检查 常见修复
节点 NotReady kubectl describe node <node> kubelet、CNI、资源、磁盘 启动/修复 kubelet;恢复 CNI;释放资源;扩容节点
Pod Pending kubectl describe pod <pod> -n <ns> 调度约束、资源不足 调整 requests/limits;修正亲和性/污点;扩容节点
ImagePullBackOff kubectl describe pod <pod> -n <ns> 镜像名/标签、凭据、网络 修正镜像;配置 imagePullSecrets;打通仓库网络
CrashLoopBackOff kubectl logs <pod> -c <c> -n <ns> --previous 应用错误、探针、OOM 修复应用;调整 liveness/readiness;增加内存 limit
Service 访问失败 kubectl get endpoints <svc>nslookup selector、Endpoints、kube-proxy、CNI 对齐标签;检查 kube-proxy 与 CNI;放通安全组/防火墙
DNS 解析失败 nslookup <svc>.<ns>.svc.cluster.local CoreDNS 状态与日志 重启 CoreDNS;检查配置与上游 DNS;校验 resolv.conf

以上流程覆盖 节点、Pod、Service、网络、系统 五个层面,按“从外向里、由易到难”的顺序执行,通常可快速定位并恢复大多数故障。

0
看了该问题的人还看了