以下是在Ubuntu上进行Kubernetes故障排查的关键步骤:
kubectl get nodes # 查看节点是否处于Ready状态
kubectl describe node <节点名> # 获取节点详细信息
kubeadm version && kubelet --version && kubectl version # 确保版本兼容
sudo systemctl status kubelet # 检查kubelet服务状态
sudo journalctl -u kubelet -f # 实时查看kubelet日志
kubectl logs <Pod名> -c <容器名> # 查看特定容器日志
kubectl describe pod <Pod名> # 获取Pod事件和状态
/etc/kubernetes/kubelet.conf
或 /var/lib/kubelet/config.yaml
ping <目标节点IP> # 测试节点间连通性
curl -I http://<服务IP>:<端口> # 检查服务端口可达性
traceroute <目标IP> # 追踪网络路径
kubectl top nodes # 查看节点资源占用
df -h # 检查磁盘空间,清理不必要的文件
kubectl logs
定位容器崩溃原因,修复应用代码或配置。kubectl get netpol
查看策略,调整规则允许必要通信。参考来源: