Debian Hadoop集群扩容主要有动态扩容(添加新节点)和动态缩容(移除节点)两种方式,具体方法如下:
hdfs-site.xml中添加dfs.hosts属性,列出允许连接的DataNode网络地址;在ResourceManager节点的yarn-site.xml中添加yarn.resourcemanager.nodes.include-path属性,列出允许连接的NodeManager网络地址。slaves文件(或include文件),添加所有DataNode和NodeManager的主机名。hadoop-daemon.sh start datanode和yarn-daemon.sh start nodemanager,启动DataNode和NodeManager守护进程。hdfs dfsadmin -refreshNodes和yarn rmadmin -refreshNodes命令刷新节点列表,确认新节点已成功加入集群。hadoop-daemon.sh stop datanode和yarn-daemon.sh stop nodemanager,停止相关守护进程。slaves文件(或include文件)中删除待移除节点的主机名。hdfs dfsadmin -refreshNodes和yarn rmadmin -refreshNodes命令刷新节点列表,确认节点已成功移除。