在CentOS上故障排查HDFS问题时,可以遵循以下步骤:
systemctl status hadoop-hdfs-namenode
和 systemctl status hadoop-hdfs-datanode
检查HDFS NameNode和DataNode服务是否已经启动。如果没有启动,使用命令 systemctl start hadoop-hdfs-namenode
和 systemctl start hadoop-hdfs-datanode
启动服务。/var/log/hadoop-hdfs/
目录下。/var/log/hadoop-hdfs/hadoop-<username>-namenode-<hostname>.log
/var/log/hadoop-hdfs/hadoop-<username>-datanode-<hostname>.log
ping
命令测试节点之间的连通性。traceroute
或 mtr
命令检查网络路径,找出可能的瓶颈或故障点。hdfs-site.xml
和 core-site.xml
,确保配置正确。fs.defaultFS
dfs.namenode.rpc-address
dfs.datanode.data.dir
dfs.namenode.http-address
hdfs dfsadmin -printTopology
top
或 htop
命令检查集群中各个节点的资源使用情况,如CPU、内存和磁盘空间。iptables -L
firewall-cmd --list-all
firewall-cmd --add-port 50010/tcp --permanent
firewall-cmd --reload
hdfs dfs -ls /path/to/directory
hdfs dfs -stat %h /path/to/file
hdfs dfs -rm -r /path/to/directory
hdfs dfs -bash
hdfs dfs -chmod
和 hdfs dfs -chown
命令修改权限和所有者。hdfs dfs -chown 用户名:组名 /目标路径
命令。hdfs dfsadmin -safemode leave
命令退出安全模式。通过以上步骤,可以系统地排查HDFS在CentOS上的故障。如果问题仍然存在,建议查看相关日志文件和系统信息,以便进一步定位问题。