YARN任务提交启动的流程是什么

发布时间:2021-10-12 14:56:02 作者:iii
来源:亿速云 阅读:159

本篇内容介绍了“YARN任务提交启动的流程是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

【名词概念】


首先来说明下yarn中的一些概念,后续流程中都会涉及到。

【整体流程】


首先通过一张图来看下客户端提交任务到最终运行的整体流程。

YARN任务提交启动的流程是什么

  1. 客户端向RM提交应用,本质上是向RM请求启动AM

  2. RM选择合适的NM,并向NM发送请求,要求启动AM

  3. NM收到启动AM的请求后,根据所携带的参数,下载AM所依赖的资源到本地

  4. 完成依赖资源的本地化后,NM启动AM进程

  5. AM启动后向RM进行注册,并向RM申请启动任务containr所需的资源

  6. RM根据NM的资源汇报情况,向AM回复资源(container)的分配情况,即给请求的任务container分配具体的NM。

  7. AM根据任务container分配的NM,向对应的NM发送请求,要求启动任务container

  8. NM收到启动任务container的请求后,同样根据请求参数,先完成依赖资源的本地化,然后启动任务container进程。


整体流程中有几点需要注意:

【RM中的流程】


前面概念中提到了application、container以及AM。在RM中,分别用Application,Container,AppAttempt类来对应这三个概念。整个任务提交运行流程也就围绕这三个类实例的创建,以及各自的状态机变化完成。

当然,还有一块内容未涉及,那就是调度器模块,这里暂不深入,后续再单独整理说明。

来看看任务提交运行在RM中的流程:

YARN任务提交启动的流程是什么

  1. 客户端向RM申请Application的ID

  2. RM内部生成application的唯一ID

  3. 通过rpc响应将applicaiton ID告知客户端

  4. 客户端携带ID,以及container上下文,通过RPC向RM提交任务。

  5. RM的rpc服务将请求转发给内部的AppManager模块。

  6. AppManager创建一个App实例对象(RMAppImpl)。

  7. 随后向该实例对象发送start事件。

  8. RMAppImpl收到事件后,向状态存储服务请求保存App状态,状态从NEW变为NEW_SAVING。

  9. 状态存储服务完成APP信息的存储后,再以事件的形式告知RMAppImpl。

  10. RMAppImpl向调度器发送添加APP的事件,状态从NEW_SAVING变为SUBMITTED。

  11. 调度器收到消息后,进行相应的处理动作,然后告知RMAppImpl应用被接受。

  12. RMAppImpl创建Attempt实例对象(RMAppAttemptImpl),

  13. 然后,向其发送start事件,随后状态从SUBMITTED变为ACCEPTED。

  14. Attempt创建后,先向ApplicationMasterService进行注册,使其在内存中有对应的记录,方便后面真正的AM进程进行注册。

  15. 然后,向调度器发送添加Attempt事件。

  16. 调度器同样进行一系列的处理,包括权限判断,队列应用计数等,在内存中记录相关信息,最后通知Attempt成功添加。

  17. Attempt调用调度器的接口,申请启动AM所需的资源,同时状态从NEW变为SUBMITTED。

  18. 当有NM节点向RM发送心跳请求时,RM内部最终会以事件的形式通知到调度器,调度器则选择合适的应用为其分配资源。

  19. 资源分配过程中,会新建Container对象(RMContainerImpl)。

  20. 然后向Container对象发送start事件。

  21. container收到start事件后,告知attempt,资源已经完成分配。自身状态从NEW切换为ALLOCATED。

  22. attempt收到事件后,通过接口向调度器获取已分配的资源,然后状态从SUBMITTED切换为SCHEDULED。

  23. 调度器的接口处理过程中会向container发送acquire事件。Container的状态从ALLOCATED切换为ACQUIRED。

  24. 随后,attempt向状态存储模块发送请求,要求存储attempt的信息。自身状态从SCHEDULED切换为ALLOCATED_SAVING。

  25. 状态存储完成后,以事件的形式告诉attempt。

  26. attmpt向AMLaunch模块发送启动AM的请求。自身状态从ALLOCATED_SAVING切换为ALLOCATED。

  27. AMLaunch通过RPC协议向指定的NM发送startContainer的请求。

  28. AMLaunch告知Attempt,container已启动,Attempt的状态从ALLOCATED切换为LAUNCHED。

  29. NM收到请求后,启动AM进程

  30. AM进程启动后向RM中的ApplicationMasterService进行注册。

  31. ApplicationMasterService收到注册请求后,告知对应的Attempt。Attempt的状态从LAUNCHED切为RUNNING。

  32. Attempt收到AM进程并成功注册的消息后,进而告诉RMAppImpl。App的状态从ACCEPTED转换为RUNNING。

注:NM通过心跳告知RM节点上container的运行状态,RM内部处理该消息最终通知对应container,container状态从ACQUIRED转为RUNNING。

【NM中的流程】


与RM不同,在NM中并不感知container是具体任务还是AM,因此内部只有application和container,任务运行流程也就围绕这两个类实例的创建,状态机的变化及周边配套模块完成。

在NM中,任务运行的流程如下图所示:

YARN任务提交启动的流程是什么

  1. NM内部的containerManagerImpl处理启动container的请求,先新建一个AppImpl(App的具体实现,后面简称为App)的实例对象,然后向该APP发送一个初始化事件,然后新建一个ContainerImpl(Container的具体实现,后面简称为Container)对象。

  2. App向日志聚合模块发送请求,告知App启动,要求进行相应的初始化动作,同时状态从NEW变为INITING。

  3. 日志聚合模块完成app的初始化动作后,通过事件告知App。

  4. APP收到事件后,接着向资源本地化服务模块发送请求,要求完成App所依赖资源的下载。

  5. 资源本地化服务模块完成对应的资源下载后,通过事件告知App。

  6. App收到事件后,向Container发送初始化事件,同时状态从INITING变为RUNNING。

  7. Container同样向资源本地化服务模块发送请求,要求完成Container所依赖资源的下载,此时状态从NEW变为LOCALIZING

  8. 资源本地化服务模块每成功完成一个资源的下载,都会以事件的形式通知Container。

  9. 当Container感知所有依赖资源都完成本地化后,通过事件告知资源本地化服务模块进行清理动作(这里的清理动作不是清理资源文件,而是结束相应的资源下载进程)。

  10. Container继续向Container启动服务模块发送请求,要求启动具体的Container进程,随后状态从LOCALIZING变为LOCALIZED。

  11. Container启动服务模块根据Container上下文,设置环境变量、启动参数生成启动脚本,并创建Container的进程,然后通过事件告知Container。

    Container收到进程启动的事件后,状态从LOCALIZED变为RUNNING。

  12. 当Container的进程运行结束后,其对应的创建线程获取其结束码,并通知Container。(假设这里为运行成功并正常结束)

  13. Container收到事件后,向资源本地化服务模块发送请求,要求清理资源文件,然后状态从RUNNING切换为EXITED_WITH_SUCCESS。

  14. 资源本地化服务模块对Container的资源文件进行清理后,告知Container。

  15. Container通知日志聚合模块运行结束,让其准备进行日志聚合。

  16. 随后也通知App,Container运行结束,最后状态切换为DONE。

  17. App感知Container运行结束后,只是在内存中进行相关的记录,NM通过心跳向RM上报所有container的运行状况。RM会再通过心跳告知AM,当AM得知所有任务均结束时,向RM进行注销,并自身退出。RM得知AM结束后,进行相应的处理动作,最终告知该应用对应任务containerd的NM,应用结束。NM内部最终告知App。

  18. App收到消息后,通知资源本地化服务模块进行资源的清理。然后自身状态从RUNNING切换为APPLICATION_RESOURCE_CLEANUP。

  19. 资源化本地服务模块完成资源清理后事件通知App。

  20. App通知日志聚合模块进行日志聚合,最后状态变为FINISHED。

“YARN任务提交启动的流程是什么”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注亿速云网站,小编将为大家输出更多高质量的实用文章!

推荐阅读:
  1. Yarn的基础介绍以及job的提交流程
  2. spark入门知识和job任务提交流程

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

yarn

上一篇:SQL Server中With As中递归的使用方法

下一篇:如何给自定义Web控件添加事件

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》