centos

CentOS Hadoop 集群如何搭建

小樊
52
2025-10-07 08:17:05
栏目: 智能运维

CentOS环境下搭建Hadoop分布式集群全流程(以3节点为例)

一、前置准备

1. 虚拟机/物理机基础配置
2. 软件环境要求

二、Hadoop安装与配置

1. 下载与解压Hadoop
2. 核心配置文件修改

进入$HADOOP_HOME/etc/hadoop目录,修改以下关键配置文件:

3. SSH免密登录配置

三、启动集群

1. 格式化NameNode

仅在首次启动时执行,用于初始化HDFS元数据:

hdfs namenode -format

(注意:格式化会清除原有数据,生产环境需谨慎。)

2. 启动HDFS

在Master节点执行以下命令,启动HDFS相关进程(NameNode、DataNode):

start-dfs.sh

查看进程是否启动:jps(Master节点应看到NameNodeSecondaryNameNode;Slave节点应看到DataNode)。

3. 启动YARN

在Master节点执行以下命令,启动YARN相关进程(ResourceManager、NodeManager):

start-yarn.sh

查看进程是否启动:jps(Master节点应看到ResourceManager;Slave节点应看到NodeManager)。

四、集群验证

1. Web界面检查
2. 命令行检查
3. 运行示例程序

使用Hadoop自带的WordCount示例验证集群功能:

# 创建输入目录并上传文件
hdfs dfs -mkdir -p /input
hdfs dfs -put $HADOOP_HOME/etc/hadoop/*.xml /input

# 运行WordCount程序
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.4.1.jar wordcount /input /output

# 查看输出结果
hdfs dfs -cat /output/part-r-00000

若输出单词统计结果,则说明集群搭建成功。

注意事项

0
看了该问题的人还看了