Hadoop2.x与hadoop的区别

发布时间:2020-06-06 01:28:43 作者:colapanda
来源:网络 阅读:456

Hadoop2.x与hadoop的区别

NameNode在启动的时候,需要将Mettadata加载到内存中去,随着集群扩大,元数据的量也随之增加,内存压力过大。

Hadoop2.x与hadoop的区别

Hadoop1.x的缺点和解决办法:

  1. 单点故障------à HA  一主多备

  2. 内存受限 -----àNN Federation 

Hadoop2.x与hadoop的区别

  1. Hadoop节点之间的通信都是采用心跳机制。

  2. 元数据放在一片共享区(主NN和备NN共享)称为Journal Node 集群

  3. 所有DN节点都要实时向主NN或备NN通信,告知NN自己有哪么些block等信息。

  4. 至于DN具体要向NN(主)还是NN(),它会向zookeeper请示,zookeer知道那个节点是主,并知道它的状态。

  5. 当主NN的状态由FailoverControllerActive进行心跳检测,通知zookeeper,并在它发生故障时,做切换,同样备NN也有相应的FailoverControllerStandby  

  6. 通过命令可手动停止主NN启动备NN,甚至调换角色,用于HDFS升级等场合

Hadoop2.x与hadoop的区别

Hadoop2.x与hadoop的区别

Hadoop2.x与hadoop的区别

NN Fderation:将HDFS分成多个完全独立的NN的运行,彼此互不干扰,但是集群共享DN

 

  1. 多个NN共用一个集群里DN上的存储资源,每个NN都可以单独对外提供服务

  2. 每个NN都会定义一个存储池,有单独的id,每个DN都为所有存储池提供存储

  3. DN会按照存储池id向其对应的NN汇报块信息,同时,DN会向所有NN汇报本地存储可用资源情况

  4. 如果需要在客户端方便的访问若干个NN上的资源,可以使用客户端挂载表,把不同的目录映射到不同的NN,但NN上必须存在相应的目录

Hadoop2.x与hadoop的区别

Yarn主要功能:

  1. 负责资源管理,任务调度

  2. 支持多种第三方计算框架

 

Hadoop2.x与hadoop的区别


推荐阅读:
  1. hadoop2.x 将namenode 与 SecondaryNameNode 分开部署
  2. hadoop 2.7.7 安装(测试环境部署) hadoop2.x部署

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

hadoop doop had

上一篇:sed命令详解和实例

下一篇:AD用户批量创建和属性修改工具推荐-ADBulkAdmin

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》