Ubuntu HDFS集群扩容分为横向扩容(新增节点)和纵向扩容(提升单机硬件),以下是具体步骤及注意事项:
JAVA_HOME
和HADOOP_HOME
环境变量。hdfs-site.xml
:$HADOOP_HOME/etc/hadoop/hdfs-site.xml
中,添加或修改以下配置,指定数据存储路径(可多个路径用逗号分隔):<property>
<name>dfs.datanode.data.dir</name>
<value>/path/to/new/data/directory</value>
</property>
core-site.xml
:fs.defaultFS
指向集群的NameNode地址(如hdfs://namenode:9000
)。$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
hdfs dfsadmin -refreshNodes
hdfs balancer
hdfs dfsadmin -report
http://namenode:9870
)检查节点状态。ext4
格式)。/mnt/newdisk
),并修改/etc/fstab
实现开机自动挂载。hdfs-site.xml
,在dfs.datanode.data.dir
中添加新挂载目录路径。sudo systemctl restart hadoop-datanode
hdfs balancer
命令重新平衡数据。参考来源: