排查CentOS HDFS故障可按以下步骤进行:
systemctl status hadoop-hdfs-namenode和systemctl status hadoop-hdfs-datanode确认服务是否正常运行。/var/log/hadoop-hdfs/目录下的NameNode和DataNode日志,定位错误信息。hdfs-site.xml和core-site.xml,确保fs.defaultFS、dfs.namenode.rpc-address等配置正确。ping和traceroute命令检查节点间网络连通性,确保端口(如8020)开放。top或htop查看CPU、内存使用情况,用df -h确认磁盘空间充足。hdfs dfsadmin -report查看集群状态,用hdfs fsck检查文件系统完整性。hdfs dfsadmin -safemode leave退出。/var/log/messages)。若问题仍未解决,可结合具体错误日志进一步分析或寻求社区支持。