在CentOS上升级Kubernetes集群的详细步骤
升级前必须备份集群核心数据,确保故障时可快速恢复:
etcdctl snapshot save /var/lib/etcd/backup/snapshot.db
cp /root/.kube/config /root/.kube/config.backup
sudo yum update -y
cat <<EOF | sudo tee /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.28/rpm/
enabled=1
gpgcheck=1
gpgkey=https://mirrors.aliyun.com/kubernetes-new/core/stable/v1.28/rpm/repodata/repomd.xml.key
EOF
kubeadm是升级集群的核心工具,需先升级至目标版本:
sudo yum update -y kubeadm
通过kubeadm upgrade plan命令查看可升级的版本及所需操作:
sudo kubeadm upgrade plan
输出会显示当前版本、可升级的目标版本及兼容性检查结果。
使用kubeadm upgrade apply命令升级Master节点(替换<目标版本>,如v1.28.2):
sudo kubeadm upgrade apply v1.28.2
yes继续。kube-apiserver、kube-controller-manager、kube-scheduler):sudo systemctl restart kube-apiserver kube-controller-manager kube-scheduler
sudo yum update -y kubelet
sudo systemctl daemon-reload
sudo systemctl restart kubelet
sudo yum update -y kubectl
避免升级过程中新Pod调度到该节点:
kubectl cordon <节点名称> # 如 kubectl cordon k8s-node01
将节点上的Pod安全驱逐至其他节点(--ignore-daemonsets忽略DaemonSet管理的Pod,--force强制驱逐):
kubectl drain <节点名称> --ignore-daemonsets --force
操作与Master节点一致:
sudo yum update -y kubelet kubectl
sudo systemctl daemon-reload
sudo systemctl restart kubelet
使用kubeadm upgrade node命令升级Worker节点(需指定Master节点的Kubeadm版本):
sudo kubeadm upgrade node
升级完成后,允许节点重新接收Pod调度:
kubectl uncordon <节点名称>
确认所有节点状态为Ready:
kubectl get nodes
确保所有Pod正常运行(无Error或CrashLoopBackOff):
kubectl get pods --all-namespaces
查看Kubernetes组件日志,排查潜在错误:
sudo journalctl -u kubelet -f # 实时查看kubelet日志
sudo journalctl -u kube-apiserver -f # 查看apiserver日志
若升级成功且无问题,可删除旧版本组件以释放空间:
sudo yum remove -y kubeadm-<旧版本> kubelet-<旧版本> kubectl-<旧版本>
kubelet参数、CNI配置),升级前备份并检查新版本的配置兼容性。