linux

Hadoop集群如何在Linux上实现高可用

小樊
38
2025-12-12 15:37:16
栏目: 智能运维

Linux上实现Hadoop高可用

一、架构要点

二、环境与角色规划

三、关键配置步骤

四、初始化与启动顺序

  1. 启动 ZooKeeper 集群(所有 zk 节点)。
  2. 启动 JournalNode(jn1/jn2/jn3):hdfs --daemon start journalnode
  3. 格式化 Active NameNodehdfs namenode -format(仅首次)。
  4. 在另一台 NameNode 上引导 Standby:hdfs namenode -bootstrapStandby
  5. 初始化 ZKFC(在 nn1、nn2 上):hdfs zkfc -formatZK
  6. 启动 NameNodehdfs --daemon start namenode(两台)。
  7. 启动 ZKFC 守护进程hdfs --daemon start zkfc(两台)。
  8. 启动 ResourceManager(rm1、rm2):yarn --daemon start resourcemanager
  9. 启动 NodeManagerDataNode(各工作节点):yarn --daemon start nodemanagerhdfs --daemon start datanode
  10. 验证:
    • HDFS Web:http://nn1:50070http://nn2:50070 应显示 Active/Standby
    • 执行 hdfs dfsadmin -reportyarn node -list 检查集群健康;
    • 客户端使用 nameservice(如 hdfs://mycluster)进行读写,验证自动故障转移。

五、验证与运维要点

0
看了该问题的人还看了