Ubuntu HDFS存储扩展主要有**横向扩容(新增节点)和纵向扩容(提升单机硬件)**两种方式,具体操作如下:
JAVA_HOME
和HADOOP_HOME
环境变量。hdfs-site.xml
中添加新节点的DataNode存储路径(如dfs.datanode.data.dir
),并更新workers
文件(路径:/usr/local/hadoop/etc/hadoop/workers
),添加新节点主机名。scp
命令)。hdfs --daemon start datanode
,启动DataNode服务。hdfs dfsadmin -report
命令查看新节点是否加入集群。hdfs balancer -threshold 5
(-threshold
为负载差异阈值,单位%),将数据均匀分布到新节点。fdisk
或lsblk
命令添加新硬盘,格式化并挂载到指定目录(如/data2
),修改/etc/fstab
实现开机自动挂载。hdfs-site.xml
中dfs.datanode.data.dir
属性,添加新挂载目录(多个目录用逗号分隔),例如:<property>
<name>dfs.datanode.data.dir</name>
<value>/data1,/data2</value>
</property>
sudo systemctl restart hadoop-datanode
。参考来源: