Ubuntu下HDFS故障排查方法
一 快速定位流程
二 常见故障与修复
三 关键命令清单
| 目标 | 命令示例 |
|---|---|
| 查看进程 | jps |
| NameNode 安全模式 | hdfs dfsadmin -safemode get |
| 退出安全模式 | hdfs dfsadmin -safemode leave |
| 集群健康与节点 | hdfs dfsadmin -report |
| 目录权限与属主 | hdfs dfs -ls /path;hdfs dfs -chmod 755 /path;hdfs dfs -chown user:group /path |
| ACL 细粒度授权 | hdfs dfs -setfacl -m user:alice:rwx /path |
| 数据块与完整性 | hdfs fsck / -files -blocks -locations |
| 空间使用 | hdfs dfs -df -h |
| 本地磁盘与负载 | df -h;du -sh /data;top/htop |
| 服务状态与启停 | systemctl status hadoop-hdfs-namenode;systemctl start hadoop-hdfs-datanode |
四 配置与网络检查要点
五 日志与监控