在Ubuntu上安装和配置Hadoop涉及多个步骤,包括安装Java、下载Hadoop、配置环境变量、格式化HDFS以及启动Hadoop服务等。以下是详细的步骤指南:
首先,确保你的系统上安装了Java。你可以使用以下命令来安装OpenJDK 8:
sudo apt update
sudo apt install openjdk-8-jdk -y
安装完成后,验证Java是否安装成功:
java -version
访问Apache Hadoop官网,选择合适的版本下载。例如,下载Hadoop 3.3.6版本:
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
解压下载的压缩包到/usr/local目录:
sudo tar -xzvf hadoop-3.3.6.tar.gz -C /usr/local
编辑~/.bashrc文件,添加Hadoop和Java的环境变量:
nano ~/.bashrc
在文件末尾添加以下内容:
export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
保存并关闭文件后,运行以下命令使更改生效:
source ~/.bashrc
编辑Hadoop的配置文件,这些文件位于/usr/local/hadoop/etc/hadoop/目录下。
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/data/nn</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/data/dn</value>
    </property>
</configuration>
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>
<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>
在首次启动Hadoop之前,需要对HDFS进行格式化:
hdfs namenode -format
启动HDFS和YARN服务:
start-dfs.sh
start-yarn.sh
使用以下命令检查Hadoop是否启动成功:
jps
你应该能看到Namenode、Datanode、ResourceManager和NodeManager等相关进程。
为了方便管理,可以配置SSH免密登录:
ssh-keygen -t rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 600 ~/.ssh/authorized_keys
通过以上步骤,你应该能够在Ubuntu上成功安装和配置Hadoop。如果遇到问题,请参考官方文档或相关社区资源进行排查。