Zookeeper自带多组命令行工具,适合快速检查集群状态,无需额外安装:
./zkCli.sh -server <host:port>
连接集群,执行stat
(查看服务器状态)、ls
(列出节点)、get
(获取节点数据)等命令,获取节点状态、数据及会话信息。echo <command> | nc <host> 2181
执行,常用命令包括:
mntr
:输出关键性能指标(平均延迟、最大延迟、活跃连接数、待处理请求数、Z节点数量等);ruok
:检查服务器是否运行(返回“imok”表示正常);stat
:显示服务器状态(客户端连接数、会话数、节点数等)。/path/to/zookeeper/bin/zkServer.sh status
可快速查看服务器运行状态(Leader/Follower/Standby)。metricsProvider
配置(metricsProvider.classname=org.apache.zookeeper.metrics.prometheus.PrometheusMetricsProvider
),开启Prometheus指标接口,Prometheus定时抓取指标并在Grafana中创建仪表盘,展示CPU使用率、内存占用、请求延迟、连接数等指标,支持告警。check_zookeeper
插件监控Zookeeper状态(节点存活、连接数、队列长度等),支持分布式监控,适合传统运维场景。zookeeper.ini
文件(command=/path/to/zookeeper/bin/zkServer.sh start-foreground
),实现Zookeeper进程的自动启动、重启及状态监控,适合需要简单进程管理的场景。systemctl status zookeeper
命令查看Zookeeper服务状态(运行/停止/失败),journalctl -u zookeeper -f
实时查看服务日志,适合通过systemd管理Zookeeper服务的场景。以上工具覆盖了从命令行到图形化、从基础到高级的监控需求,可根据团队技术栈(如是否已有Prometheus/Grafana)、监控粒度(如是否需要实时可视化)选择合适的工具组合。