在CentOS上配置Hadoop HDFS的步骤如下:
-
安装和配置JDK:
- 下载JDK安装包(例如,jdk-8u212-linux-x64.tar.gz)并将其解压到指定目录(如/opt/modules)。
- 编辑/etc/profile文件,添加Java和Hadoop的环境变量,然后使配置生效。
-
配置SSH免密登录:
- 生成SSH密钥(ssh-keygen -t rsa),并将公钥添加到本地authorized_keys文件中,以实现免密登录。
-
下载和解压Hadoop:
- 下载Hadoop安装包(例如,hadoop-3.3.1.tar.gz)并解压到指定目录(如/opt/modules)。
-
配置Hadoop环境变量:
- 编辑/etc/profile文件,添加Hadoop的路径和环境变量,然后使配置生效。
-
修改配置文件:
- 编辑core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml文件,配置HDFS和YARN的相关参数。
-
格式化NameNode:
- 在第一次启动HDFS之前,需要格式化NameNode,命令为:
hdfs namenode -format
。
-
启动HDFS:
- 使用以下命令启动HDFS:
sbin/start-dfs.sh
- 启动YARN(如果需要):
sbin/start-yarn.sh
```。
-
验证配置:
- 使用
jps
命令检查Hadoop进程是否启动成功。
- 通过Web界面(默认端口为50070)访问HDFS的管理页面,验证配置是否成功。
这些步骤涵盖了从安装依赖到启动服务的整个过程,确保在CentOS上成功配置Hadoop HDFS。