HDFS在Linux中实现高可用性的步骤与关键配置

一、高可用性架构概述

HDFS的高可用性（HA）通过双NameNode（Active/Standby）架构解决单点故障问题。其中，Active NameNode处理客户端请求，Standby NameNode同步Active节点的元数据，当Active节点故障时，Standby节点通过ZooKeeper协调快速切换为Active状态，确保服务连续性。核心组件包括：

NameNode：管理文件系统元数据（目录树、块位置等）。
Standby NameNode：同步Active元数据，准备故障切换。
JournalNode：存储NameNode的编辑日志（EditLog），确保Active与Standby元数据一致。
ZooKeeper：监控NameNode状态，协调故障转移（自动Failover）。
DataNode：存储实际数据块，向所有NameNode汇报块信息。

二、前置准备

环境要求：
- 至少3台Linux服务器（用于NameNode、JournalNode、DataNode，建议奇数台保证ZooKeeper多数派）。
- 所有节点安装相同版本的Hadoop（如2.9.2+），并配置JDK（1.8+）。
- 确保节点间网络互通（关闭防火墙或开放必要端口：8020/RPC、50070/HTTP、2181/ZooKeeper、8485/JournalNode）。
基础配置：
- 所有节点配置主机名与IP映射（/etc/hosts），避免DNS解析问题。
- 配置SSH免密登录（Active/Standby节点之间），便于Standby节点拉取Active元数据。

三、核心配置步骤

1. 配置Hadoop核心参数

（1）修改`core-site.xml`

设置HDFS的默认文件系统地址（指向HA集群名称）和ZooKeeper集群地址（用于故障转移协调）：

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://mycluster</value> <!-- 集群逻辑名称 -->
    </property>
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>zk1:2181,zk2:2181,zk3:2181</value> <!-- ZooKeeper集群地址 -->
    </property>
</configuration>

（2）修改`hdfs-site.xml`

配置HA相关参数，包括NameNode标识、RPC/HTTP地址、共享编辑日志路径、JournalNode目录等：

<configuration>
    <!-- 集群逻辑名称 -->
    <property>
        <name>dfs.nameservices</name>
        <value>mycluster</value>
    </property>
    <!-- NameNode列表（Active:nn1, Standby:nn2） -->
    <property>
        <name>dfs.ha.namenodes.mycluster</name>
        <value>nn1,nn2</value>
    </property>
    <!-- Active NameNode RPC地址 -->
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn1</name>
        <value>namenode1:8020</value>
    </property>
    <!-- Standby NameNode RPC地址 -->
    <property>
        <name>dfs.namenode.rpc-address.mycluster.nn2</name>
        <value>namenode2:8020</value>
    </property>
    <!-- Active NameNode HTTP地址 -->
    <property>
        <name>dfs.namenode.http-address.mycluster.nn1</name>
        <value>namenode1:50070</value>
    </property>
    <!-- Standby NameNode HTTP地址 -->
    <property>
        <name>dfs.namenode.http-address.mycluster.nn2</name>
        <value>namenode2:50070</value>
    </property>
    <!-- 共享编辑日志路径（JournalNode集群地址） -->
    <property>
        <name>dfs.namenode.shared.edits.dir</name>
        <value>qjournal://journalnode1:8485;journalnode2:8485;journalnode3:8485/mycluster</value>
    </property>
    <!-- JournalNode数据目录 -->
    <property>
        <name>dfs.journalnode.edits.dir</name>
        <value>/opt/hadoop/journaldata</value>
    </property>
    <!-- 客户端故障转移代理（自动选择Active节点） -->
    <property>
        <name>dfs.client.failover.proxy.provider.mycluster</name>
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
    </property>
    <!-- 故障转移策略（SSH强制终止Standby进程） -->
    <property>
        <name>dfs.ha.fencing.methods</name>
        <value>sshfence</value>
    </property>
    <!-- SSH私钥路径（用于故障转移） -->
    <property>
        <name>dfs.ha.fencing.ssh.private-key-files</name>
        <value>/home/hadoop/.ssh/id_rsa</value>
    </property>
</configuration>

2. 启动JournalNode服务

JournalNode负责存储NameNode的编辑日志（EditLog），确保Active与Standby元数据一致。在所有JournalNode节点上执行：

$HADOOP_HOME/sbin/hadoop-daemon.sh start journalnode

验证状态：

jps | grep JournalNode  # 应看到JournalNode进程

3. 格式化与启动NameNode

（1）格式化Active NameNode

在第一个NameNode节点（如namenode1）上执行格式化（仅第一次启动时需要）：

hdfs namenode -format

（2）启动Active NameNode

$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode

（3）同步元数据到Standby NameNode

在第二个NameNode节点（如namenode2）上执行，同步Active节点的元数据：

hdfs namenode -bootstrapStandby

（4）启动Standby NameNode

$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode

验证两个NameNode状态：

hdfs haadmin -getServiceState nn1  # 应显示"active"
hdfs haadmin -getServiceState nn2  # 应显示"standby"

4. 配置ZooKeeper集群（可选但推荐）

若使用ZooKeeper实现自动故障转移，需提前部署ZooKeeper集群（3节点）：

在所有ZooKeeper节点上安装并配置zoo.cfg（指定集群节点ID和地址）。
启动ZooKeeper服务：
```
zkServer.sh start
```

创建HDFS HA专用ZooKeeper路径：

zkCli.sh -server zk1:2181 create /hadoop-ha/mycluster ""

四、验证高可用性

检查集群状态：
使用命令查看NameNode和DataNode运行情况：
```
hdfs dfsadmin -report
```
应显示两个NameNode（一个Active、一个Standby）和多个DataNode。
模拟故障切换：
手动停止Active NameNode（如namenode1）：
```
$HADOOP_HOME/sbin/hadoop-daemon.sh stop namenode
```
观察Standby NameNode（namenode2）是否自动切换为Active（通过hdfs haadmin -getServiceState nn2验证）。
客户端访问测试：
使用hdfs dfs命令读写数据，验证故障切换后客户端仍能正常访问HDFS。

五、注意事项

数据一致性：确保JournalNode数量≥3（奇数），避免脑裂问题。
监控与预警：使用Prometheus+Granafa等工具监控NameNode状态、ZooKeeper会话，及时告警故障。
定期备份：备份NameNode元数据（如/opt/hadoop/dfs/name/current），防止数据丢失。
版本兼容：Hadoop各组件版本需一致（如Hadoop 3.x系列），避免兼容性问题。

0 赞

0 踩

HDFS如何在Linux中实现高可用性