Hadoop在Ubuntu上的故障排查步骤如下:
jps
命令查看NameNode、DataNode、ResourceManager等关键进程是否正常运行。$HADOOP_HOME/logs
目录,用tail -f
或grep
命令分析日志,重点关注错误信息。ping
命令测试集群节点间连通性,确保防火墙开放Hadoop所需端口(如9000、8088等)。core-site.xml
、hdfs-site.xml
、yarn-site.xml
等配置正确,尤其是路径、端口等参数。top
、iostat
等工具监控CPU、内存、磁盘使用情况,排查资源不足问题。hdfs dfsadmin -report
查看数据节点状态,确保节点正常注册。stop-all.sh
)并重新启动(start-all.sh
)Hadoop服务。hdfs namenode -format
,注意会清除数据)。chown
修改文件/目录所有者。参考来源:[1,2,3,4,5,6,8,9,10,11]