ubuntu

Ubuntu上HDFS配置步骤是什么

小樊
52
2025-08-26 02:12:42
栏目: 智能运维

以下是在Ubuntu上配置HDFS的步骤:

  1. 安装Java

    sudo apt update  
    sudo apt install openjdk-8-jdk  # 或 openjdk-11-jdk  
    java -version  # 验证安装  
    
  2. 下载并解压Hadoop

    wget https://downloads.apache.org/hadoop/common/hadoop-3.3.4/hadoop-3.3.4.tar.gz  
    tar -xzvf hadoop-3.3.4.tar.gz -C /usr/local/  
    sudo mv hadoop-3.3.4 hadoop  # 可选:重命名目录  
    
  3. 配置环境变量
    编辑~/.bashrc,添加:

    export HADOOP_HOME=/usr/local/hadoop  
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin  
    source ~/.bashrc  
    
  4. 配置HDFS核心文件
    进入$HADOOP_HOME/etc/hadoop,编辑以下文件:

    • core-site.xml
      <property>  
        <name>fs.defaultFS</name>  
        <value>hdfs://localhost:9000</value>  
      </property>  
      
    • hdfs-site.xml
      <property>  
        <name>dfs.replication</name>  
        <value>1</value>  # 单节点设为1  
      </property>  
      <property>  
        <name>dfs.namenode.name.dir</name>  
        <value>/usr/local/hadoop/data/namenode</value>  
      </property>  
      <property>  
        <name>dfs.datanode.data.dir</name>  
        <value>/usr/local/hadoop/data/datanode</value>  
      </property>  
      
    • yarn-site.xml(若需YARN):
      <property>  
        <name>yarn.nodemanager.aux-services</name>  
        <value>mapreduce_shuffle</value>  
      </property>  
      
  5. 格式化NameNode

    hdfs namenode -format  
    
  6. 启动HDFS

    start-dfs.sh  
    
  7. 验证HDFS

    • 查看进程:jps(应看到NameNode、DataNode)
    • 访问Web界面:http://localhost:50070

可选:若需配置YARN,需编辑mapred-site.xml并启动YARN服务。
注意:多节点集群需配置SSH免密登录、修改hdfs-site.xmldfs.namenode.secondary.http-address等参数。

0
看了该问题的人还看了