以下是Ubuntu环境下HDFS的故障排查方法:
/var/log/hadoop-hdfs/),搜索错误信息或异常堆栈。hdfs dfsadmin -report查看节点健康、副本数等状态,确认NameNode是否正常通信。core-site.xml、hdfs-site.xml等配置,确保参数(如fs.defaultFS、副本数)正确。ping测试节点间网络,netstat或ss查看端口监听状态,确保防火墙未拦截HDFS端口(默认50070等)。df -h检查DataNode磁盘空间,top/htop监控CPU/内存使用,确保资源充足。hdfs fsck /检测损坏块,配合-delete删除无效块或从备份恢复。hdfs dfsadmin -safemode leave退出(谨慎操作)。dfs.namenode.fs-limits.min-block-size。工具推荐:可使用Ganglia/Prometheus监控集群性能,或通过HDFS Web界面(NameNode默认端口9870)查看实时状态。