debian

Kubernetes故障排查在Debian上怎么做

小樊
35
2025-12-09 04:17:08
栏目: 智能运维

Debian上Kubernetes故障排查实操手册

一 快速定位流程

二 节点与系统层检查

三 常见故障与修复对照表

症状 快速检查 修复建议
节点 NotReady kubectl describe node;journalctl -u kubelet 确认容器运行时就绪、网络插件已部署、内核参数与模块正确、节点资源充足
Pod 状态 ErrImagePull/ImagePullBackOff kubectl describe pod;查看镜像名与仓库 修正镜像名/标签;私有仓库在节点放置 CA 证书至 /etc/docker/certs.d//ca.crt;必要时使用可拉取镜像
Service 访问不通 kubectl get svc;curl/nc 测试;节点防火墙 核对 ports/targetPort;确认 Service type(ClusterIP/NodePort/LoadBalancer);开放节点端口与云厂商安全组
节点加入失败(kubeadm join) 检查 token/caCert/hash;admin.conf 权限 在控制面重新生成 kubeadm token create --print-join-command;确保 /etc/kubernetes/admin.conf 权限正确并分发到工作节点
网络插件异常(Pod 间不通/Service 解析失败) kubectl get pods -n kube-system;kubectl logs 重新部署网络插件(如 Flannel/Calico);检查 IP forwardingiptables/nftables 规则与网段配置
证书错误(API/客户端) curl -vk;检查 kubeconfig 证书 更新/重新签发证书;客户端使用 –cacert 指定 CA;临时排障可用 -k(生产禁用)
磁盘压力导致 Pod 被驱逐(Evicted) kubectl get pods -A 清理节点磁盘(容器日志、镜像、临时文件);扩容磁盘或调整驱逐阈值
DNS 解析失败 kubectl get pods -n kube-system -l k8s-app=coredns;kubectl logs 确认 CoreDNS 运行且配置正确;检查上游 DNS 与 NetworkPolicy 是否阻断 UDP/TCP 53

四 日志与可观测性

五 高频命令清单

0
看了该问题的人还看了