在CentOS上分配Hadoop资源主要通过配置YARN实现,核心步骤如下:
安装与配置YARN
sudo yum install hadoop-yarn。yarn-site.xml,设置ResourceManager和NodeManager参数,如yarn.resourcemanager.hostname。设置资源分配策略
yarn.scheduler.capacity.root.queues等参数。yarn.scheduler.fair.allocation.file指向调度策略文件。调整资源参数
yarn.nodemanager.resource.memory-mb。yarn.scheduler.minimum-allocation-mb和yarn.scheduler.maximum-allocation-mb。mapreduce.map.memory.mb。启用动态资源分配
mapred-site.xml中启用动态分配:mapreduce.job.dynamic.max.executors。监控与优化
http://resourcemanager:8088)监控资源使用情况。关键配置文件:
yarn-site.xml:定义资源管理器和调度策略。capacity-scheduler.xml/fair-scheduler.xml:配置队列资源分配。参考来源: