在Ubuntu上配置HDFS需注意以下关键点:
系统准备
JAVA_HOME
、PATH
)。hadoop
)并设置sudo权限,避免使用root用户。核心配置文件
core-site.xml
:设置NameNode地址(如fs.defaultFS=hdfs://localhost:9000
)和临时目录。hdfs-site.xml
:配置副本数(dfs.replication
,默认3)、NameNode和DataNode存储路径。yarn-site.xml
:若需集成YARN,配置资源管理相关参数。存储与权限
hdfs namenode -format
。/data
)权限正确(chown -R hadoop:hadoop /data
)。性能优化
dfs.blocksize
,如128MB或256MB,平衡存储与访问效率)。dfs.client.read.shortcircuit
)减少网络延迟。启动与验证
start-dfs.sh
(伪分布模式无需start-yarn.sh
)。jps
查看NameNode/DataNode进程,或访问Web界面(如http://localhost:9870
)。安全与维护
hadoop/logs
目录),避免磁盘占满。参考资料: