在CentOS上安装HDFS(Hadoop分布式文件系统)服务,可以按照以下步骤进行:
安装Java:Hadoop需要Java运行环境。
sudo yum install java-1.8.0-openjdk-devel
配置Java环境变量:
编辑/etc/profile.d/java.sh文件,添加以下内容:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export PATH=$PATH:$JAVA_HOME/bin
然后执行:
source /etc/profile.d/java.sh
下载Hadoop: 访问Hadoop官网,选择合适的版本下载。例如:
wget https://archive.apache.org/dist/hadoop/common/hadoop-3.3.1/hadoop-3.3.1.tar.gz
解压Hadoop:
tar -xzvf hadoop-3.3.1.tar.gz -C /opt
重命名目录:
sudo mv /opt/hadoop-3.3.1 /opt/hadoop
编辑配置文件: 进入Hadoop目录并编辑相关配置文件。
core-site.xml:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
</configuration>
hdfs-site.xml:
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/opt/hadoop/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/opt/hadoop/data/datanode</value>
</property>
</configuration>
yarn-site.xml:
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>resourcemanager</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
mapred-site.xml:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
hdfs namenode -format
start-dfs.sh
start-yarn.sh
检查HDFS状态:
jps
应该能看到NameNode、SecondaryNameNode、DataNode等进程。
访问Web界面:
http://namenode:50070http://resourcemanager:8088生成SSH密钥:
ssh-keygen -t rsa
分发公钥:
ssh-copy-id namenode
ssh-copy-id resourcemanager
/opt/hadoop/etc/hadoop/slaves文件,添加所有DataNode的主机名或IP地址。通过以上步骤,你应该能够在CentOS上成功安装并配置HDFS服务。如果有任何问题,请参考Hadoop官方文档或社区支持。