Ubuntu HDFS存储扩展主要有**横向扩容(新增节点)和纵向扩容(提升单机硬件)**两种方式,具体操作如下:
JAVA_HOME和HADOOP_HOME环境变量。hdfs-site.xml中添加新节点的DataNode存储路径(如dfs.datanode.data.dir),并更新workers文件(路径:/usr/local/hadoop/etc/hadoop/workers),添加新节点主机名。scp命令)。hdfs --daemon start datanode,启动DataNode服务。hdfs dfsadmin -report命令查看新节点是否加入集群。hdfs balancer -threshold 5(-threshold为负载差异阈值,单位%),将数据均匀分布到新节点。fdisk或lsblk命令添加新硬盘,格式化并挂载到指定目录(如/data2),修改/etc/fstab实现开机自动挂载。hdfs-site.xml中dfs.datanode.data.dir属性,添加新挂载目录(多个目录用逗号分隔),例如:<property>
<name>dfs.datanode.data.dir</name>
<value>/data1,/data2</value>
</property>
sudo systemctl restart hadoop-datanode。参考来源: