centos

HDFS在CentOS上的故障排除

小樊
45
2025-12-07 22:32:35
栏目: 智能运维

HDFS在CentOS上的故障排除手册

一、快速定位流程

二、常见故障与修复对照表

症状 快速检查 修复建议
NameNode 启动失败,报 IncorrectVersionException 查看 NameNode 日志;检查 dfs.namenode.name.dir 目录 确认版本一致;必要时备份后清理该目录的 VERSION 文件并重新 hdfs namenode -format(会清空元数据)
DataNode 未注册或反复掉线 hdfs dfsadmin -report 看不到节点;查看 DataNode 日志 核对 fs.defaultFSdfs.datanode.data.dir;检查网络/防火墙;确保 /etc/hosts 与主机名一致
客户端报 Connection refused 或无法访问 50070 telnet <namenode_ip> 8020/50070 失败 开放端口(如 8020/9000/50070);排查防火墙/安全组;确认服务已启动
安全模式导致写入失败 hdfs dfsadmin -safemode get 显示 ON 数据充足后自动退出;紧急可用 hdfs dfsadmin -safemode leave(不建议生产频繁使用)
Permission denied 本地与 HDFS 权限;执行用户 使用 hdfs dfs -chmod / -chown 调整;或以具备权限的用户执行
DiskSpaceQuotaExceededException df -h 与 HDFS 配额 清理空间;按需调整配额 hdfs dfsadmin -setQuota
配置文件错误(XML 语法、路径不存在) 启动日志提示 XML/IO 异常 校验 core-site.xmlhdfs-site.xml 语法与目录权限;确保路径存在且可写
版本/环境变量问题 java -version$JAVA_HOME 为空或错误 hadoop-env.sh/etc/profile 正确设置 JAVA_HOMEHADOOP_HOMEsource 生效

三、关键配置与端口清单

四、应急与恢复操作

五、最小化验证命令清单

0
看了该问题的人还看了