ubuntu

Zookeeper故障排查Ubuntu怎么办

小樊
44
2025-12-06 21:31:58
栏目: 智能运维

Ubuntu 上 Zookeeper 故障排查步骤

一 快速定位流程

二 常见故障对照表

症状 高频原因 快速修复
启动显示 STARTED,但 zkServer.sh status 报 “Error contacting service. It is probably not running.” 配置目录未创建(dataDir/dataLogDir);myid 缺失或值不匹配;主机名/端口写错;防火墙阻断;进程未真正起来 创建 dataDir/dataLogDir;在 dataDir 写入正确的 myid(与 server.X 一致);核对 zoo.cfg 的 server 配置与主机名;ufw 放行端口或临时关闭;用 start-foreground 看实时报错
“Starting zookeeper … FAILED TO START” 或 “nohup: failed to run command ‘java’: No such file or directory” JAVA_HOME 未设置 或 PATH 无 java;使用了不含二进制文件的安装包(3.5.5+ 需带 bin 的包);Java 版本不兼容 正确设置 JAVA_HOME 与 PATH;下载并使用带 bin 的发行包(apache-zookeeper-x.y.z-bin.tar.gz);必要时改用 Java 8 稳定版本
“Error: Could not find or load main class org.apache.zookeeper.server.quorum.QuorumPeerMain” 包不完整(缺少 lib/ 或编译类);错误地把源码包当二进制包运行 使用带 bin 的二进制包;不要混用 3.4.x 与 3.5.x 的目录结构;如仍异常,清理后重装
java.net.BindException: Address already in use 2181/2888/3888 端口被占用 结束占用进程或修改 zoo.cfg 的 clientPort 与会话端口
集群无法选主或节点异常 myid 重复或缺失;server.X 主机名不可达;防火墙未放行 确保每个节点 myid 唯一且匹配 server.X;修正主机名/IP;ufw/firewalld 放行相关端口,核对 /etc/hosts 解析

三 关键配置与目录检查

四 服务管理与验证

五 环境与权限要点

0
看了该问题的人还看了