hdfs dfsadmin -report:查看集群状态,包括DataNode数量、容量等。hdfs fsck /:检查文件系统完整性,检测损坏块。hdfs balancer:平衡集群数据分布。http://<namenode-host>:9870(Hadoop 3.x),查看集群健康、存储使用等。top/htop/iostat等工具监控节点资源,确保磁盘、内存、网络正常。hdfs-site.xml参数,如dfs.replication(副本数)、dfs.blocksize(块大小)。hdfs balancer平衡数据分布,避免节点负载不均。hdfs dfsadmin -refreshNodes更新节点列表。| 场景 | 命令 | 说明 | 
|---|---|---|
| 查看集群状态 | hdfs dfsadmin -report | 
显示节点状态、容量等概览 | 
| 检查文件系统 | hdfs fsck / | 
检测损坏块,修复文件系统 | 
| 数据平衡 | hdfs balancer | 
均衡集群数据分布 | 
| 启动/停止服务 | start-dfs.sh/stop-dfs.sh | 
一键启停HDFS服务 | 
| 查看日志 | tail -f /var/log/hadoop-hdfs/*.log | 
实时查看NameNode/DataNode日志 | 
通过以上方法,可实现对HDFS集群的全面监控与高效维护,确保系统稳定运行。具体工具选择需结合集群规模和实际需求,建议定期演练故障处理流程,提升应急响应能力。