您好,登录后才能下订单哦!
密码登录
登录注册
点击 登录注册 即表示同意《亿速云用户服务条款》
# Spark中yarn-site.xml的最小化怎么配置
## 引言
在Spark on YARN模式下,`yarn-site.xml`是Hadoop YARN框架的核心配置文件之一,它决定了资源调度、任务分配等关键行为。对于生产环境或资源受限的场景,最小化配置可以避免资源浪费并提升稳定性。本文将介绍Spark中`yarn-site.xml`的最小化配置方案。
---
## 一、基础必选参数
### 1. 资源管理器地址
```xml
<property>
<name>yarn.resourcemanager.address</name>
<value>resourcemanager-host:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>resourcemanager-host:8030</value>
</property>
<property>
<name>yarn.nodemanager.local-dirs</name>
<value>/data/yarn/nm-local-dir</value>
</property>
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>1024</value> <!-- 最小1GB -->
</property>
<property>
<name>yarn.scheduler.minimum-allocation-vcores</name>
<value>1</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>spark_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.spark_shuffle.class</name>
<value>org.apache.spark.network.yarn.YarnShuffleService</value>
</property>
<property>
<name>yarn.nodemanager.resourcemanager.connect.retry-interval.ms</name>
<value>2000</value>
</property>
如果启用Kerberos认证:
<property>
<name>yarn.resourcemanager.principal</name>
<value>yarn/_HOST@REALM</value>
</property>
<configuration>
<!-- 基础配置 -->
<property>
<name>yarn.resourcemanager.address</name>
<value>rm1:8032</value>
</property>
<!-- 资源分配 -->
<property>
<name>yarn.scheduler.minimum-allocation-mb</name>
<value>1024</value>
</property>
<!-- Spark专用 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>spark_shuffle</value>
</property>
</configuration>
$HADOOP_CONF_DIR/yarn-site.xml
$HADOOP_HOME/sbin/stop-yarn.sh
$HADOOP_HOME/sbin/start-yarn.sh
最小化配置的核心原则是: - 保留必要的通信参数 - 设置合理的资源下限 - 根据Spark特性启用辅助服务 - 避免不必要的复杂调度策略
实际部署时建议通过yarn rmadmin -refreshNodes
动态加载配置变更,减少服务重启次数。
“`
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。