CentOS上诊断HBase故障可按以下步骤进行:
/var/log/hbase/目录下的日志文件,定位错误信息或异常堆栈。status 'detailed'、balance_switch等命令查看集群状态、Region分布等。hbase-site.xml、hdfs-site.xml中参数正确,如hbase.cluster.distributed、端口配置等。top、free、df等工具检查CPU、内存、磁盘空间是否充足。ping、netstat等工具确认节点间网络连通性,确保HBase端口(如16010、16030)未被占用。hdfs dfsadmin -report查看HDFS健康状况,确保数据目录可写。hbase hbck:修复元数据不一致、Region分配异常等问题。hbase zkcli:检查Zookeeper状态,确保集群协调正常。hbase hbck -fix系列命令修复元数据和数据块。