CentOS上HDFS集群扩容步骤如下:
准备工作
/etc/hosts
文件。添加新节点
hdfs-site.xml
中添加新节点的IP和端口,在core-site.xml
中配置NameNode地址。hdfs namenode -format
(会清除数据,需提前备份)。hdfs --daemon start datanode
,通过jps
或NameNode Web界面(http://namenode:9870)验证是否加入集群。数据负载均衡
hdfs balancer -threshold 5
(默认阈值10%,可根据需求调整),使数据均匀分布在各节点。验证与监控
hdfs dfsadmin -report
查看集群状态、节点列表及数据分布。注意事项:
dfs.datanode.data.dir
配置,Hadoop 3+支持单节点内磁盘均衡。