排查CentOS HDFS故障可按以下步骤进行:
systemctl status hadoop-hdfs-namenode
和systemctl status hadoop-hdfs-datanode
确认服务是否正常运行。/var/log/hadoop-hdfs/
目录下的NameNode和DataNode日志,定位错误信息。hdfs-site.xml
和core-site.xml
,确保fs.defaultFS
、dfs.namenode.rpc-address
等配置正确。ping
和traceroute
命令检查节点间网络连通性,确保端口(如8020)开放。top
或htop
查看CPU、内存使用情况,用df -h
确认磁盘空间充足。hdfs dfsadmin -report
查看集群状态,用hdfs fsck
检查文件系统完整性。hdfs dfsadmin -safemode leave
退出。/var/log/messages
)。若问题仍未解决,可结合具体错误日志进一步分析或寻求社区支持。