Linux下Hadoop故障排查方法如下:
tail -f或grep分析HADOOP_HOME/logs目录下的日志,定位错误信息。jps命令确认NameNode、DataNode等关键进程是否正常运行。ping或traceroute测试节点间连通性,检查防火墙是否开放必要端口(如50070、8088等)。core-site.xml、hdfs-site.xml等配置项是否正确,重点关注路径、端口等参数。top、iostat、vmstat等工具监控CPU、内存、磁盘使用情况,排查性能瓶颈。namespaceID一致性,或删除临时文件重新格式化。/etc/hosts文件确保主机名解析正确。-Xms、-Xmx)或增加节点内存。yarn logs获取应用日志,或通过ELK、Grafana等工具进行日志聚合与可视化分析。参考来源: