ubuntu

Ubuntu HDFS配置环境搭建指南

小樊
43
2025-10-27 07:53:46
栏目: 智能运维

Ubuntu环境下HDFS配置环境搭建指南

1. 环境准备

2. 安装Java环境

Hadoop依赖Java运行,需安装OpenJDK 8(Hadoop 3.x兼容版本):

3. 下载并解压Hadoop

4. 配置Hadoop环境变量

5. 配置Hadoop核心文件

进入Hadoop配置目录$HADOOP_HOME/etc/hadoop,修改以下文件:

5.1 core-site.xml

配置HDFS的默认文件系统地址(本地模式):

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

5.2 hdfs-site.xml

配置NameNode和DataNode的数据目录、副本数(本地模式设为1):

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value> <!-- 集群模式下需调整为数据节点数量 -->
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop/data/datanode</value>
    </property>
</configuration>

5.3 mapred-site.xml(若未存在则创建)

配置MapReduce框架为YARN:

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

5.4 yarn-site.xml

配置YARN资源管理器:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

6. 创建HDFS数据目录

7. 格式化NameNode

首次启动HDFS前,需格式化NameNode以初始化文件系统元数据:

hdfs namenode -format

格式化后会生成VERSION文件和edits日志,注意:格式化会清除已有数据,生产环境需谨慎操作

8. 启动HDFS服务

9. 验证HDFS功能

10. 配置防火墙(可选但推荐)

允许Hadoop服务端口通过防火墙,避免网络访问被拦截:

sudo ufw allow 9000  # NameNode RPC端口
sudo ufw allow 9870  # HDFS Web UI端口
sudo ufw allow 50070 # 旧版本HDFS Web UI端口

注意事项

0
看了该问题的人还看了