CentOS下HBase故障排查可按以下步骤进行:
/var/log/hbase/目录下hbase-hbase-master-*.log和hbase-hbase-regionserver-*.log,定位错误信息。hbase-site.xml中hbase.rootdir、hbase.zookeeper.quorum等参数正确,hbase-env.sh中JAVA_HOME等环境变量无误。jps命令查看HMaster、RegionServer进程是否运行,若异常需重启服务。netstat确认HBase端口(如60000、60020)未被占用,测试节点间网络连通性。top、free、df等命令检查内存、CPU、磁盘空间是否充足。zkCli.sh检查ZooKeeper状态,用hdfs dfsadmin -report确认HDFS健康,确保数据目录可写。hbase hbck:修复元数据不一致、Region分配异常等问题。hbase shell:执行status、balance_switch等命令查看集群状态。hbase-env.sh中堆内存参数,优化GC策略。hbase hbck -fixHdfsHoles修复Region链断裂,必要时重建表。/hbase/MasterProcWALs),检查依赖服务(ZooKeeper、HDFS)是否正常。若问题仍未解决,可参考HBase官方文档或社区论坛寻求帮助[1,2,3,4,5,6,7,8,9,10,11,12]。