在CentOS上部署Kubernetes(k8s)并进行故障排查时,可以遵循以下步骤:
kubectl get nodes
命令检查节点状态,确保所有节点正常运行。kubectl get pods --all-namespaces
命令获取所有Pod的状态。kubectl describe pod <pod_name>
查看详细信息,以便深入排查问题。kubectl get events
命令查看集群中发生的事件,这些事件可能包含有关故障的线索。free -g
cat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -l
dd
命令测试4k小文件读写速度。journalctl -xe | grep kubelet
tail -f /var/log/messages
dmesg -T
tail -f /sysvol/mariadb/mariadb_data/mysql-error.log
cannot allocate memory
或 no space left on device
错误,检查是否存在内存泄露。/sys/fs/cgroup/memory/kubepods/memory.kmem.slabinfo
文件,判断是否存在内存泄露。kubectl get pv
, kubectl get pvc
, 和 kubectl get storageclass
命令检查存储相关状态。kubectl logs <pod_name> -c <container_name>
查看特定Pod中容器的日志输出。通过以上步骤,可以系统地排查和解决在CentOS上部署的Kubernetes集群可能遇到的故障。根据具体情况,可能还需要进一步调查或采取其他措施。