Ubuntu Hadoop资源管理主要通过YARN配置实现,以下是关键步骤(基于Hadoop 3.x版本):
JAVA_HOME
环境变量。~/.bashrc
中添加HADOOP_HOME
、PATH
等变量,使配置生效。core-site.xml
:设置HDFS地址(如fs.defaultFS=hdfs://localhost:9000
)。hdfs-site.xml
:配置NameNode和DataNode数据存储路径、副本数(伪分布式设为1)。mapred-site.xml
:指定资源管理框架为YARN(mapreduce.framework.name=yarn
)。yarn-site.xml
:
yarn.nodemanager.aux-services=mapreduce_shuffle
)。localhost
)。hdfs namenode -format
(首次启动需执行)。start-yarn.sh
,通过jps
查看ResourceManager
和NodeManager
进程是否正常。http://localhost:8088
),查看集群资源使用情况。说明:伪分布式模式下,所有服务运行在同一节点,适合测试环境;分布式环境需配置多节点主机名、SSH免密登录及对应配置文件。
参考资料: