Ubuntu系统中HDFS配置文件的修改位置及步骤
Ubuntu下HDFS的配置文件集中存储在Hadoop主目录的etc/hadoop子目录中,路径由$HADOOP_HOME环境变量决定。具体路径可通过以下命令获取:
echo $HADOOP_HOME
若未设置HADOOP_HOME,默认路径通常为/usr/local/hadoop/etc/hadoop(需根据实际安装位置调整)。
HDFS的核心配置主要涉及以下两个XML文件,修改它们可实现HDFS路径、副本数、块大小等参数的调整:
core-site.xml该文件配置Hadoop核心系统参数,其中**fs.defaultFS**是HDFS的默认文件系统地址(必改项),用于指定NameNode的地址和端口。
示例配置(修改前需备份原文件):
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value> <!-- 本地模式常用,生产环境需替换为NameNode实际地址 -->
</property>
</configuration>
修改方法:使用文本编辑器(如nano、vim)打开文件,找到<property>标签内的value值并修改,保存后退出。
hdfs-site.xml该文件配置HDFS特定参数,包括NameNode/Datanode数据目录、副本数等。
示例配置:
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value> <!-- 数据块副本数(单节点伪分布式设为1,生产环境建议≥3) -->
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/usr/local/hadoop/data/namenode</value> <!-- NameNode元数据存储路径 -->
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/usr/local/hadoop/data/datanode</value> <!-- DataNode数据存储路径 -->
</property>
</configuration>
修改方法:同样使用文本编辑器打开文件,调整对应property的value值,保存后退出。
cp core-site.xml core-site.xml.bak),避免配置错误导致服务无法启动。dfs.namenode.name.dir或dfs.datanode.data.dir的路径,需提前创建目录并赋予Hadoop用户(如hdfs)读写权限:sudo mkdir -p /usr/local/hadoop/data/namenode
sudo mkdir -p /usr/local/hadoop/data/datanode
sudo chown -R hdfs:hdfs /usr/local/hadoop/data
$HADOOP_HOME/sbin/stop-dfs.sh # 停止HDFS
$HADOOP_HOME/sbin/start-dfs.sh # 启动HDFS
jps命令检查NameNode、DataNode进程是否启动,或访问HDFS Web界面(如http://localhost:50070)查看集群状态。通过以上步骤,即可完成Ubuntu系统中HDFS配置文件的修改与生效。