Kubernetes安装后如何验证 - 问答

Kubernetes安装后验证步骤

1. 检查Kubernetes组件状态

核心组件（kube-apiserver、kube-controller-manager、kube-scheduler、etcd）是集群的“大脑”，需确保其正常运行。

命令：kubectl get componentstatuses
正常输出应显示所有组件状态为Healthy（如controller-manager Healthy ok、etcd-0 Healthy {"health":"true"}）。
补充：若组件状态异常（如Unhealthy或Unknown），需检查对应服务的systemctl状态（如systemctl status kube-apiserver）或日志（如journalctl -u kube-apiserver）。

2. 验证节点状态

节点是Pod运行的载体，需确认所有节点处于Ready状态。

命令：kubectl get nodes
正常输出应显示所有节点的STATUS列为Ready（如node-1 Ready control-plane 30d v1.27.0）。
异常排查：若节点状态为NotReady，需检查节点上的kubelet服务（systemctl status kubelet）、网络连接（如节点间是否能互通）或磁盘空间（是否因磁盘满导致kubelet异常）。

3. 检查Pod运行情况

Pod是Kubernetes的最小调度单元，需确保系统Pod（如CoreDNS、kube-proxy）和用户Pod运行正常。

查看系统Pod：kubectl get pods -n kube-system
正常输出应无CrashLoopBackOff（应用不断重启）、ImagePullBackOff（镜像拉取失败）、Pending（调度失败）等异常状态（如coredns-78fcd69978-ckc9b Running 0 20d）。
查看用户Pod：kubectl get pods -A（查看所有命名空间）或kubectl get pods（查看当前命名空间），确认用户部署的Pod（如之前创建的Nginx Pod）状态为Running。

4. 测试Service与网络功能

Service是Pod的访问入口，需验证其能否正常分配端口并转发流量。

部署测试应用：

kubectl create deployment nginx --image=nginx  # 创建Nginx Deployment
kubectl expose deployment nginx --type=NodePort --port=80  # 暴露为NodePort类型Service

检查Service状态：kubectl get svc nginx
正常输出应显示EXTERNAL-IP为<pending>（集群IP）和分配的PORT(S)（如80:30080/TCP）。
访问应用：通过任意节点IP和NodePort访问Nginx（如curl http://<节点IP>:30080），应返回Nginx默认页面（包含“Welcome to nginx!”字样）。

5. 验证集群网络连通性与DNS解析

网络是Kubernetes集群的基础，需确保Pod间能通信且DNS解析正常。

测试Pod间通信：创建临时Pod（如Alpine），测试与其他Pod或Service的通信：

kubectl run test-pod --image=alpine --rm -it --restart=Never -- sh
# 在临时Pod内执行：
ping kubernetes.default.svc.cluster.local  # 测试DNS解析（应能解析到Service IP）
ping <其他节点IP>  # 测试跨节点通信（应能通）
exit

说明：若ping不通，需检查网络插件（如Calico、Flannel）是否正常运行（kubectl get pods -n kube-system | grep calico），或节点防火墙是否放行了Kubernetes相关端口（如10250、6443）。

6. 检查kubelet服务状态

kubelet是节点上的代理，负责管理节点上的Pod和容器，其状态直接影响节点和Pod的运行。

命令：在每个节点上执行systemctl status kubelet
正常输出应显示Active: active (running)（如kubelet.service: Active: active (running) since Mon 2025-10-20 10:00:00 CST; 5h ago）。
异常排查：若kubelet未运行，需启动服务（systemctl start kubelet）并查看日志（journalctl -u kubelet），排查启动失败原因（如证书过期、配置文件错误）。

7. 检查etcd健康状态（可选，但重要）

etcd是Kubernetes的分布式键值存储，存储了集群的所有配置数据，需确保其健康。

命令：在控制平面节点上执行（需进入etcd容器）：

ETCDCTL_API=3 etcdctl --endpoints=https://127.0.0.1:2379 \
--cacert=/etc/kubernetes/pki/etcd/ca.crt \
--cert=/etc/kubernetes/pki/etcd/server.crt \
--key=/etc/kubernetes/pki/etcd/server.key \
endpoint health

正常输出应显示127.0.0.1:2379 is healthy: successfully committed proposal。

通过以上步骤，可全面验证Kubernetes集群的安装是否成功。若所有检查项均正常，说明集群具备基本的运行能力；若存在异常，可根据错误信息针对性排查（如组件状态异常查日志、Pod挂起查资源或调度问题）。

0 赞

0 踩