Ubuntu Hadoop集群扩展步骤
sudo apt install openjdk-11-jdk -y)、配置静态IP(通过netplan编辑/etc/netplan/01-network-manager-all.yaml并应用)、设置主机名(sudo hostnamectl set-hostname newnode)。/etc/hosts文件中添加集群节点的IP与主机名映射(如192.168.1.10 master、192.168.1.11 newnode),确保节点间能互相ping通。配置SSH免密登录:在主节点生成密钥(ssh-keygen -t rsa),将公钥(id_rsa.pub)复制到新节点(ssh-copy-id hadoop@newnode),测试免密登录(ssh newnode)。$HADOOP_HOME/etc/hadoop目录下的核心配置文件(core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、workers)复制到新节点的相同目录。这些文件需保持集群一致性,避免配置冲突。$HADOOP_HOME/etc/hadoop/workers文件中,添加新节点的主机名(每行一个,如newnode)。该文件用于定义集群中的DataNode和NodeManager节点。dfs.replication,默认3)大于新节点数量,需修改hdfs-site.xml中的dfs.replication为新节点数量(如<property><name>dfs.replication</name><value>2</value></property>),或在后续通过hdfs dfsadmin -setReplication <path> <replication>命令调整特定路径的副本数。hdfs --daemon start datanode
yarn --daemon start nodemanager
可通过jps命令验证服务是否启动(应显示DataNode和NodeManager进程)。hdfs dfsadmin -refreshNodes # 刷新NameNode,识别新DataNode
yarn rmadmin -refreshNodes # 刷新ResourceManager,识别新NodeManager
执行后,可通过hdfs dfsadmin -report查看DataNode列表,或yarn node -list查看NodeManager列表,确认新节点已加入。start-balancer.sh
默认平衡阈值为10%(数据块分布差异不超过10%),可通过-threshold参数调整(如start-balancer.sh -threshold 5),平衡过程需一定时间(取决于数据量和网络带宽)。9870、ResourceManager默认端口8088)查看集群节点列表,确认新节点的状态为“Live”。或使用命令行:hdfs dfsadmin -report | grep "Live datanodes" # 查看DataNode数量
yarn node -list | grep "RUNNING" # 查看NodeManager数量
hdfs dfs -put /local/file /test),然后查看文件块分布(hdfs fsck /test -files -blocks -locations),确认新节点存储了部分数据块。core-site.xml、hdfs-site.xml)必须一致,避免因配置差异导致节点无法正常工作。