在Ubuntu上配置HDFS需注意以下关键点:
系统准备
JAVA_HOME、PATH)。hadoop)并设置sudo权限,避免使用root用户。核心配置文件
core-site.xml:设置NameNode地址(如fs.defaultFS=hdfs://localhost:9000)和临时目录。hdfs-site.xml:配置副本数(dfs.replication,默认3)、NameNode和DataNode存储路径。yarn-site.xml:若需集成YARN,配置资源管理相关参数。存储与权限
hdfs namenode -format。/data)权限正确(chown -R hadoop:hadoop /data)。性能优化
dfs.blocksize,如128MB或256MB,平衡存储与访问效率)。dfs.client.read.shortcircuit)减少网络延迟。启动与验证
start-dfs.sh(伪分布模式无需start-yarn.sh)。jps查看NameNode/DataNode进程,或访问Web界面(如http://localhost:9870)。安全与维护
hadoop/logs目录),避免磁盘占满。参考资料: