在Linux上扩展Hadoop存储主要有以下两种方式:
core-site.xml
、hdfs-site.xml
)与集群现有节点一致。hadoop-daemon.sh start datanode
启动DataNode服务。hdfs dfsadmin -report
或NameNode Web界面(http://namenode:50070)确认新节点已加入集群。mkfs.ext4 /dev/sdb1
(根据实际设备名调整)。mkdir /data/hadoop
。mount /dev/sdb1 /data/hadoop
,并编辑/etc/fstab
实现开机自动挂载。hdfs-site.xml
中添加新存储路径:<property>
<name>dfs.datanode.data.dir</name>
<value>/data/hadoop,/path/to/existing/data</value> <!-- 多个路径用逗号分隔 -->
</property>
使用hdfs balancer
命令重新分配数据块,避免存储不均。
注意事项:
参考来源: