debian

Debian上Hadoop安装步骤解析

小樊
59
2025-09-01 12:15:59
栏目: 智能运维

1. 准备工作
在Debian系统上安装Hadoop前,需完成基础环境准备:

2. 安装Java环境
Hadoop依赖Java运行环境,需安装OpenJDK(推荐11及以上版本):

sudo apt update
sudo apt install openjdk-11-jdk -y

验证Java安装是否成功:

java -version

输出应包含Java版本信息(如openjdk version "11.0.xx")。

3. 下载并解压Hadoop
访问Apache Hadoop官网(https://hadoop.apache.org/releases.html)下载最新稳定版(如3.3.6),使用wget命令下载:

wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz

解压至/usr/local目录(系统级安装路径):

sudo tar -xzvf hadoop-3.3.6.tar.gz -C /usr/local/

重命名解压后的目录以便管理:

sudo mv /usr/local/hadoop-3.3.6 /usr/local/hadoop

修改Hadoop目录权限,确保当前用户(如hadoop)拥有读写权限:

sudo chown -R hadoop:hadoop /usr/local/hadoop

4. 配置Hadoop环境变量
编辑系统全局环境变量文件/etc/profile(或用户级文件~/.bashrc),添加Hadoop相关变量:

sudo nano /etc/profile

在文件末尾添加以下内容(根据实际安装路径调整):

export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64  # Java安装路径
export HADOOP_HOME=/usr/local/hadoop                # Hadoop安装路径
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin  # 添加Hadoop命令到PATH

保存并退出(Ctrl+OEnterCtrl+X),使配置生效:

source /etc/profile

验证环境变量是否配置成功:

echo $HADOOP_HOME  # 应输出Hadoop安装路径
hadoop version     # 应显示Hadoop版本信息

5. 配置Hadoop核心文件
进入Hadoop配置目录($HADOOP_HOME/etc/hadoop),编辑以下关键文件:

6. 配置SSH免密登录
Hadoop节点间需通过SSH无密码通信,以下以hadoop用户为例:

7. 格式化HDFS
HDFS首次启动前需格式化NameNode(仅第一次需要,会清除原有数据):

hdfs namenode -format

格式化完成后,会在dfs.name.dir指定的路径下生成元数据目录。

8. 启动Hadoop服务

9. 验证安装

0
看了该问题的人还看了