ubuntu

如何在Ubuntu中配置HDFS

小樊
49
2025-10-02 02:30:16
栏目: 智能运维

在Ubuntu中配置HDFS的详细步骤

1. 环境准备

2. 下载并解压Hadoop

3. 配置Hadoop环境变量

4. 配置HDFS核心文件

进入Hadoop配置目录$HADOOP_HOME/etc/hadoop,修改以下文件:

(1)core-site.xml

配置HDFS的默认文件系统地址(指向本地NameNode):

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

(2)hdfs-site.xml

配置NameNode和DataNode的存储路径及副本数(单机环境设为1):

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>  <!-- 单机环境设为1,集群环境需调整 -->
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/usr/local/hadoop-3.3.4/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/usr/local/hadoop-3.3.4/data/datanode</value>
    </property>
</configuration>

5. 创建HDFS数据目录

手动创建NameNode和DataNode的存储目录,并设置所有权:

sudo mkdir -p /usr/local/hadoop-3.3.4/data/namenode
sudo mkdir -p /usr/local/hadoop-3.3.4/data/datanode
sudo chown -R $USER:$USER /usr/local/hadoop-3.3.4/data  # 将目录所有者设为当前用户

6. 格式化NameNode

首次启动HDFS前,必须格式化NameNode以初始化文件系统元数据:

hdfs namenode -format

格式化后会生成VERSION文件和edits日志,注意:格式化会清除已有数据,仅首次启动需执行

7. 启动HDFS服务

使用以下命令启动HDFS(包含NameNode、DataNode等进程):

start-dfs.sh

8. 验证HDFS状态

9. 防火墙配置(可选)

若系统启用了ufw防火墙,需允许Hadoop相关端口通过:

sudo ufw allow 9000  # NameNode RPC端口
sudo ufw allow 50070 # HDFS Web界面端口

10. 常用HDFS命令示例

注意事项

通过以上步骤,即可在Ubuntu系统上完成HDFS的基本配置并启动服务。如需扩展为集群环境,还需配置slaves文件、SSH无密码登录及多节点环境变量。

0
看了该问题的人还看了