Linux下Hadoop资源管理主要涉及配置、监控、调度及优化等方面,具体如下:
core-site.xml(配置文件系统URI等核心参数)、hdfs-site.xml(设置副本数、块大小等HDFS参数)、yarn-site.xml(配置ResourceManager、NodeManager资源参数)、mapred-site.xml(指定MapReduce运行框架为YARN)。~/.bashrc或/etc/profile中添加HADOOP_HOME、PATH等变量。hdfs namenode -format),执行start-dfs.sh和start-yarn.sh启动服务。yarn-site.xml中yarn.nodemanager.resource.memory-mb等参数。http://<ResourceManager_IP>:8088)查看集群状态、应用程序资源使用情况。yarn node -list查看节点状态,yarn application -list查看运行中的任务,yarn application -kill <ID>终止任务。capacity-scheduler.xml或fair-scheduler.xml中设置队列资源分配比例和优先级。mapreduce.map.memory.mb、mapreduce.reduce.memory.mb等参数,避免内存溢出。dfs.blocksize)和副本数(dfs.replication)。参考来源: