大数据Apache Hadoop YARN工作原理是什么

发布时间：2021-11-03 10:06:41 作者：iii
来源：亿速云阅读：174

这篇文章主要讲解了“大数据Apache Hadoop YARN工作原理是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究和学习“大数据Apache Hadoop YARN工作原理是什么”吧！

　　一、Apache Hadoop YARN基本构成
　　Master/Slave结构，1 个ResourceManager(RM)对应多个 NodeManager(NM);YARN 由 Client、ResourceManager、NodeManager、ApplicationMaster (AM)组成;Client 向 RM 提交任务、杀死任务等;AM由对应的应用程序完成;每个应用程序对应一个 AM，AM向RM申请资源用于在NM上启动相应的 Task;NM 向 RM通过心跳信息：汇报 NM健康状况、任务执行状况、领取任务等;

　　大数据系列之Hadoop的资源管理模块YARN
　　1、RM：整个集群只有一个，负责集群资源的统一管理和调度：
　　处理来自客户端的请求(启动/杀死应用程序);启动/监控 AM;一旦某个 AM 挂了之后，RM 将会在另外一个节点上启动该 AM;监控 NM，接收 NM的心跳汇报信息并分配任务到 NM去执行;一旦某个 NM挂了，标志下该 NM 上的任务，来告诉对应的 AM 如何处理;负责整个集群的资源分配和调度;
　　2、NM：整个集群中有多个，负责单节点资源管理和使用
　　周期性向 RM汇报本节点上的资源使用情况和各个 Container 的运行状;接收并处理来自 RM 的 Container 启动/停止的各种命令;处理来自 AM的命令;负责单个节点上的资源管理和任务调度;
　　3、AM：每个应用一个，负责应用程序的管理
　　数据切分;为应用程序/作业向 RM 申请资源(Container)，并分配给内部任务;与 NM通信以启动/停止任务;任务监控和容错(在任务执行失败时重新为该任务申请资源以重启任务);处理 RM发过来的命令：杀死 Container、让 NM重启等;
　　4、Container：对任务运行环境的抽象
　　任务运行资源(节点、内存、CPU);任务启动命令;任务运行环境;任务是运行在Container中，一个Container中既可以运行AM也可以运行具体的Map/Reduce/MPI/SparkTask;

　　二、YARN工作原理
　　用户向YARN 中提交应用程序/作业，其中包括 ApplicaitonMaster 程序、启动ApplicationMaster 的命令、用户程序等;ResourceManager 为作业分配第一个 Container，并与对应的 NodeManager 通信，要求它在这个 Containter 中启动该作业的 ApplicationMaster;ApplicationMaster 首先向 ResourceManager 注册，这样用户可以直接通过ResourceManager 查询作业的运行状态;然后它将为各个任务申请资源并监控任务的运行状态，直到运行结束。即重复步骤 4-7;ApplicationMaster 采用轮询的方式通过 RPC 请求向 ResourceManager 申请和领取资源;
　　一旦 ApplicationMaster 申请到资源后，便与对应的 NodeManager 通信，要求它启动任务;NodeManager 启动任务;各个任务通过 RPC 协议向 ApplicationMaster 汇报自己的状态和进度，以让ApplicaitonMaster 随时掌握各个任务的运行状态，从而可以在任务失败时重新启动任务;在作业运行过程中，用户可随时通过 RPC 向 ApplicationMaster 查询作业当前运行状态;作业完成后，ApplicationMaster 向 ResourceManager 注销并关闭自己;

　　三、YARN容错性
　　ResourceMananger基于 ZooKeeper 实现 HA 避免单点故障;NodeManager执行失败后，ResourceManager 将失败任务告诉对应的 ApplicationMaster;由 ApplicationMaster 决定如何处理失败的任务;ApplicationMaster执行失败后，由 ResourceManager 负责重启;ApplicationMaster 需处理内部任务的容错问题;RMAppMaster 会保存已经运行完成的 Task，重启后无需重新运行。

　　四、YARN调度框架
　　1、双层调度框架
　　ResourceManager 将资源分配给 ApplicationMaster;ApplicationMaster 将资源进一步分配给各个 TASK;
　　2、基于资源预留的调度策略
　　资源不够时，会为 Task 预留，直到资源充足;描述：当一个 Task 需要 10G 资源时，各个节点都不足 10G，那么就选择一个节点，但是某个 NodeManager上只有 2G，那么就在这个 NodeManager上预留，当这个 NodeManager上释放其他资源后，会将资源预留给 10G 的作业，直到攒够 10G 时，启动 Task;缺点：资源利用率不高，要先攒着，等到 10G 才利用，造成集群的资源利用率低;
　　与"all or nothing"策略不同描述：当一个作业需要 10G 资源时，节点都不足 10G慢慢等，等到某个节点上有 10G 空闲资源时再运行，很可能会导致该 Task停工。

感谢各位的阅读，以上就是“大数据Apache Hadoop YARN工作原理是什么”的内容了，经过本文的学习后，相信大家对大数据Apache Hadoop YARN工作原理是什么这一问题有了更深刻的体会，具体使用情况还需要大家实践验证。这里是亿速云，小编将为大家推送更多相关知识点的文章，欢迎关注！

大数据Apache Hadoop YARN工作原理是什么

相关阅读