ubuntu

Hadoop 集群在 Ubuntu 上怎么搭建

小樊
41
2025-06-27 19:30:38
栏目: 智能运维

搭建Hadoop集群是一个复杂的过程,涉及多个步骤和配置。以下是一个基本的指南,帮助你在Ubuntu上搭建Hadoop集群。

环境准备

安装Java

Hadoop需要Java运行环境,通常使用OpenJDK。

sudo apt update
sudo apt install openjdk-8-jdk
java -version

安装Hadoop

  1. 下载Hadoop:从Apache Hadoop官网下载最新版本的Hadoop。
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
  1. 解压Hadoop:将下载的Hadoop安装包解压到指定目录,例如/usr/local/hadoop。
sudo tar -zxvf hadoop-3.3.1.tar.gz -C /usr/local/hadoop
sudo chown -R hadoop:hadoop /usr/local/hadoop
  1. 配置Hadoop环境变量:编辑~/.bashrc文件,添加以下行:
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

然后,使用以下命令使环境变量生效:

source ~/.bashrc

配置Hadoop

  1. 编辑Hadoop配置文件
<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://localhost:9000</value>
  </property>
</configuration>
<configuration>
  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/usr/local/hadoop/hdfs/namenode</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/usr/local/hadoop/hdfs/datanode</value>
  </property>
</configuration>
<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
</configuration>
<configuration>
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>master</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>4096</value>
  </property>
</configuration>
  1. 格式化HDFS
sudo -u hdfs hadoop namenode -format
  1. 启动Hadoop服务
sudo -u hdfs hadoop-daemon.sh start namenode
sudo -u hdfs hadoop-daemon.sh start datanode
sudo -u yarn hadoop-daemon.sh start resourcemanager
sudo -u yarn hadoop-daemon.sh start nodemanager

验证集群状态

在浏览器中访问Hadoop的Web界面,例如:

如果能够看到Hadoop的Web界面,则表示Hadoop集群搭建成功。

请注意,以上步骤提供了一个基本的Hadoop集群搭建流程。根据具体需求和环境,可能需要进行更多的配置和优化。建议参考Hadoop官方文档以获取更多详细信息和进一步的配置。

0
看了该问题的人还看了