以下是Ubuntu Hadoop集群故障排除指南:
jps
命令查看Hadoop各组件进程是否正常运行。/var/log/hadoop-*
目录下相关日志文件,用tail
、grep
等命令分析错误信息。ping
命令测试节点间连通性,检查/etc/hosts
文件配置是否正确,确保防火墙允许Hadoop所需端口。core-site.xml
、hdfs-site.xml
、yarn-site.xml
等配置文件路径正确,配置项无误。top
、htop
、iostat
等命令监控CPU、内存、磁盘I/O等资源使用情况,确保资源充足。hdfs dfsadmin -report
查看HDFS状态,用yarn node -list
查看YARN节点状态。