CentOS 上 HDFS 常见冲突与处理指南
一 元数据与节点标识冲突
DataNode UUID 冲突
现象:NameNode 日志出现 “is attempting to replace the data node” 或监控界面 Live Nodes 数量少于实际节点。
原因:克隆/拷贝 DataNode 数据目录或多次格式化导致不同节点拥有相同的 datanodeUuid。
处理:
NameNode 与 DataNode namespaceID 不一致
现象:DataNode 启动失败,日志提示 “Incompatible namespaceIDs”。
原因:多次格式化 NameNode 后,NameNode 与 DataNode 的 namespaceID 不一致。
处理:
多次格式化导致集群异常
现象:节点反复注册异常、块报告异常、监控节点数异常。
处理:避免频繁格式化;若已发生,按 “UUID/namespaceID” 两类冲突的清理或对齐步骤逐一修复,并以 “hdfs dfsadmin -report” 与 NameNode Web UI 校验结果为准。
二 写入与并发冲突
三 端口与配置冲突
端口占用
现象:NameNode 启动报 “FATAL … Exception in namenode join” 或端口绑定失败。
排查与处理:检查 fs.defaultFS / dfs.namenode.rpc-address 等端口(常见如 9000)是否被占用,必要时更换端口或释放占用进程(如 netstat/ss 定位并停止相关服务)。
配置与目录权限
现象:启动失败或权限拒绝。
处理:核对 core-site.xml / hdfs-site.xml 关键项(如 dfs.namenode.name.dir、dfs.datanode.data.dir)路径、权限与属主;确保运行用户对相关目录具备读写权限。
四 快速排查与修复清单