centos

Zookeeper故障排查CentOS上如何进行

小樊
44
2025-12-15 20:26:15
栏目: 智能运维

CentOS上Zookeeper故障排查实操手册

一 快速健康检查

二 配置文件与身份校验

三 常见故障与修复对照表

症状 快速定位 修复建议
服务起不来 查看zookeeper.out;检查端口占用 释放2181或改端口;修正配置;必要时清理异常zookeeper_server.pid后重启
集群不可用/仅单机 echo stat仅见1台;查看server.X与myid 核对myidserver.X映射;确保节点间2888/3888互通;检查防火墙
客户端连不通 telnet host 2181失败 放行2181/tcp;确认监听地址为0.0.0.0或客户端可达IP
Leader频繁切换 mntr中角色频繁变更;日志有选举异常 检查网络抖动/丢包;核对tickTime/initLimit/syncLimit;排查磁盘IO与GC
会话过期/连接丢失 客户端报ZSESSIONEXPIREDZCONNECTIONLOSS 适当增大sessionTimeout;优化网络与重试;会话恢复后重新注册Watcher
权限拒绝 客户端报ZNOAUTH/ZAUTHFAILED 检查ACL配置与认证方式(如SASL/Digest)
数据目录/版本目录异常 数据或快照损坏、磁盘满 备份后清理version-2异常子目录;扩容磁盘;恢复一致性后再启动

以上对照覆盖了配置、网络、权限、会话、磁盘五大类高发问题,可据此逐项排查与修复。

四 深入诊断与稳定性加固

五 一键排查命令清单

0
看了该问题的人还看了