在CentOS上部署Kubernetes(k8s)并进行故障排查时,可以遵循以下步骤:
kubectl get nodes 命令检查节点状态,确保所有节点正常运行。kubectl get pods --all-namespaces 命令获取所有Pod的状态。kubectl describe pod <pod_name> 查看详细信息。kubectl get events 命令查看集群中发生的事件,这些事件可能包含有关故障的线索。free -gcat /proc/cpuinfo | grep "physical id" | sort | uniq | wc -ldd 命令测试4k小文件读写速度。journalctl -xe | grep kubelettail -f /var/log/messagesdmesg -Ttail -f /sysvol/mariadb/mariadb_data/mysql-error.logcannot allocate memory 或 no space left on device 错误,检查是否存在内存泄露。/sys/fs/cgroup/memory/kubepods/memory.kmem.slabinfo 文件,判断是否存在内存泄露。ping 命令测试节点之间的网络连接。kubectl get pv, kubectl get pvc, 和 kubectl get storageclass 命令检查存储相关状态。kubectl logs <pod_name> -c <container_name> 查看特定Pod中容器的日志输出。通过以上步骤,可以系统地排查和解决在CentOS上部署的Kubernetes集群可能遇到的故障。根据具体情况,可能还需要进一步调查或采取其他措施。