以下是在CentOS上搭建HDFS集群的指南:
JAVA_HOME环境变量。/etc/hosts文件使主机名与IP正确映射。/etc/profile或/etc/profile.d/hadoop.sh文件,添加HADOOP_HOME和PATH。core-site.xml:设置fs.defaultFS为hdfs://namenode:9000。hdfs-site.xml:配置副本数、NameNode和DataNode的存储目录等。mapred-site.xml和yarn-site.xml:根据需要配置MapReduce和YARN参数。在所有节点上生成SSH密钥对,将公钥复制到其他节点的~/.ssh/authorized_keys文件中。
在NameNode节点上执行hdfs namenode -format命令。
在NameNode节点上执行start-dfs.sh脚本启动HDFS集群。
使用jps命令检查NameNode、DataNode等进程是否正常运行,也可访问HDFS的Web界面或使用hdfs dfs命令测试。
配置ZooKeeper集群,修改core-site.xml和hdfs-site.xml文件以启用高可用性特性,配置JournalNode,实现NameNode的主备切换。