HDFS的基本概念介绍

发布时间:2020-08-05 00:31:50 作者:原生zzy
来源:网络 阅读:401

1. HDFS的设计思路?

  hdfs是分布式的文件系统,用来在廉价的集群上做大数据量的存储。
HDFS的基本概念介绍
1.大文件被切割成小文件,使用分而治之的思想让很多服务器对同一个文件进行联合管理
2.每个小文件做冗余备份,并且分散存到不同的服务器,做到高可靠不丢失

2. HDFS的架构?

HDFS的基本概念介绍
namenode:集群老大,掌管文件系统目录树,处理客户端读且请求
SecondaryNamenode:持久化元数据,主要给 namenode 分担压力之用
DataNode:存储整个集群所有数据块,处理真正数据读写

3. HDFS的特性?

  - HDFS 中的文件在物理上是分块存储(block),块的大小可以通过配置参数(dfs.blocksize)来规定,默认大小在 hadoop2.x 版本中是 128M,老版本中是 64M
  - HDFS 文件系统会给客户端提供一个统一的抽象目录树,客户端通过路径来访问文件
  - namenode 是 HDFS 集群主节点,负责维护整个 hdfs 文件系统的目录树,以及每一个路径(文件)所对应的 block 块信息(block 的 id,及所在的 datanode 服务器)
  - datanode 是 HDFS 集群从节点,每一个 block 都可以在多个 datanode 上存储多个副本(副本数量也可以通过参数设置 dfs.replication,默认是 3)
  - HDFS 是设计成适应一次写入,多次读出的场景,且不支持文件的修改

4. HDFS的优缺点?

推荐阅读:
  1. HDFS命令及管理HDFS
  2. MySQL关系数据库的基本概念介绍

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

hdfs hdf %d

上一篇:Java I/O API之性能分析 (下)(转)

下一篇:快被炒糊的二维材料,能帮到AI什么忙?|AI的朋友(四)

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》