在CentOS系统上配置Hadoop分布式文件系统(HDFS)是一个相对复杂的过程,涉及多个步骤。以下是一个详细的指南,帮助你在CentOS上设置HDFS环境。
sudo yum install -y java-1.8.0-openjdk-devel
/etc/sysconfig/network-scripts/ifcfg-ens33
文件,将 ONBOOT
设置为 yes
,BOOTPROTO
设置为 static
。修改主机名,编辑 /etc/hostname
和 /etc/hosts
文件,确保每个节点的主机名是唯一的且能正确解析。/usr/local/hadoop
。core-site.xml
:<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp</value>
</property>
</configuration>
hdfs-site.xml
:<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/hdfs/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/hdfs/datanode</value>
</property>
</configuration>
yarn-site.xml
和 mapred-site.xml
:用于配置YARN和MapReduce。/etc/profile
文件,添加Hadoop路径和环境变量:export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
登录后复制使配置生效:
source /etc/profile
首次启动HDFS时,需要格式化NameNode:
hdfs namenode -format
在NameNode节点上启动HDFS:
start-dfs.sh
使用以下命令检查HDFS的运行状态:
jps
确保NameNode、DataNode和SecondaryNameNode进程正常运行。
hdfs dfs -mkdir /user/test
hdfs dfs -put /path/to/localfile /user/test
hdfs dfs -ls /user/test
/etc/hosts
文件和防火墙设置,确保所有节点之间可以互相解析和通信。dfs.namenode.name.dir
和 dfs.datanode.data.dir
路径是否正确。