1. HBase自带监控工具
HBase提供了基础的集群状态查看命令和Web界面,适合快速检查集群健康状况:
status命令查看集群基本状态(如RegionServer数量、表数量),status 'simple'显示简要信息,status 'detail'显示更详细的Region、存储单元格数量等信息;还可使用table '<table_name>'查看指定表的详细状态。http://<master-ip>:16000,可查看集群整体状态、RegionServer列表、Region分布、表信息及性能统计(如读写延迟、吞吐量)。2. 第三方监控工具
第三方工具提供更全面的指标收集、可视化和告警功能,适合生产环境:
jmx_exporter收集HBase的JMX指标(如RegionServer负载、BlockCache命中率、RPC调用次数),Grafana则将这些指标可视化,创建仪表盘展示集群状态(如RegionServer负载趋势、磁盘IO使用率)。配置时需修改HBase的hbase-site.xml启用JMX,设置jmx_exporter.yaml暴露指标,再配置Prometheus抓取目标。gmetad(数据聚合)和gmond(节点监控)组件,配置gmetad.conf添加HBase集群数据源。3. 日志与命令行监控
$HBASE_HOME/logs目录(如hbase-<username>-master-<hostname>.log),使用tail -f命令实时查看日志,可快速定位故障(如RegionServer宕机、GC停顿)。jps命令查看HBase进程(HMaster、HRegionServer)是否运行;使用ping、netstat检查节点间网络连接(如HMaster与RegionServer的通信端口是否畅通);使用top、free、df检查系统资源(CPU、内存、磁盘空间)是否充足。