centos

CentOS Hadoop集群搭建步骤

小樊
54
2025-09-22 12:10:42
栏目: 智能运维

CentOS环境下Hadoop集群搭建步骤

1. 基础环境准备

1.1 网络与主机名配置

1.2 关闭防火墙与SELinux

1.3 安装JDK

1.4 安装Hadoop

2. SSH免密登录配置

3. Hadoop配置文件修改

进入$HADOOP_HOME/etc/hadoop目录,修改以下核心配置文件:

3.1 core-site.xml

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop01:9000</value> <!-- NameNode RPC地址 -->
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/hadoop/tmp</value> <!-- 临时目录 -->
  </property>
</configuration>

3.2 hdfs-site.xml

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>3</value> <!-- 数据副本数(根据节点数调整) -->
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/hadoop/dfs/name</value> <!-- NameNode元数据目录 -->
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/opt/hadoop/dfs/data</value> <!-- DataNode数据目录 -->
  </property>
</configuration>

3.3 mapred-site.xml

3.4 yarn-site.xml

<configuration>
  <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop01</value> <!-- ResourceManager所在节点 -->
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value> <!-- Shuffle服务 -->
  </property>
</configuration>

3.5 workers文件

4. 启动Hadoop集群

4.1 格式化NameNode

4.2 启动HDFS

4.3 启动YARN

4.4 启动JobHistory Server(可选)

5. 验证集群状态

注意事项

0
看了该问题的人还看了