Hadoop在Linux里数据如何存储 - 问答

Hadoop在Linux中的数据存储机制
Hadoop在Linux环境中的数据存储核心依赖Hadoop分布式文件系统（HDFS），这是一种面向海量数据的分布式存储系统，通过分块存储、副本机制、主从架构等设计，实现数据的高可靠、高吞吐和高扩展性。

一、HDFS核心组件及职责

HDFS采用Master/Slave（主从）架构，主要由以下组件构成：

NameNode（主节点）：HDFS的“大脑”，负责管理文件系统的元数据（包括目录结构、文件名、文件属性（生成时间、权限）、数据块与DataNode的映射关系等）。它处理客户端的读写请求，协调数据块的分配与复制。
DataNode（从节点）：HDFS的“工作者”，负责实际存储数据块（Block）。它们执行NameNode的指令（如创建、删除、复制数据块），并定期向NameNode发送心跳信号（报告存活状态）和块报告（汇报存储的块信息）。
Secondary NameNode（辅助节点）：并非NameNode的热备，其主要职责是定期合并NameNode的元数据（将编辑日志edits log合并到文件系统镜像fsimage中），防止编辑日志过大导致NameNode重启缓慢；在NameNode故障时，可用于辅助恢复元数据。

二、数据存储流程

1. 写入数据流程

客户端向HDFS写入数据时，遵循以下步骤：

发起请求：客户端通过HDFS API向NameNode发送文件上传请求；
元数据检查：NameNode验证文件是否已存在、父目录是否有效；
分配存储位置：NameNode根据机架感知策略（Rack Awareness），选择不同机架上的3个DataNode（默认副本数为3），返回给客户端；
数据传输：客户端将文件按固定大小分块（默认128MB），依次通过FSDataOutputStream将数据块写入第一个DataNode；该DataNode接收到数据后，立即复制到后续DataNode（逐级传输），形成“流水线”写入模式；
确认完成：所有DataNode写入成功后，向NameNode发送确认；NameNode更新元数据，标记文件存储完成。

2. 读取数据流程

客户端从HDFS读取数据时，流程如下：

定位块位置：客户端向NameNode发送文件读取请求，NameNode返回数据块的位置列表（按就近原则排序，优先选择同一机架或本地的DataNode）；
并行读取：客户端直接从列表中的第一个DataNode读取数据块；若该副本不可用（如节点故障），自动切换到下一个副本；
数据重组：客户端将读取到的所有数据块按顺序拼接，还原为原始文件。

三、关键存储机制

1. 数据分块（Block）

HDFS将大文件分割为固定大小的数据块（默认128MB，可通过dfs.blocksize参数调整），这种设计的好处是：

提高并行处理能力（多个数据块可同时被不同节点处理）；
减少小文件问题（小文件可合并存储，降低NameNode元数据压力）；
适配分布式存储（数据块可分散存储在不同节点，提高吞吐量）。

2. 副本机制（Replication）

为保证数据可靠性，HDFS为每个数据块存储多个副本（默认3个），副本的存放遵循机架感知策略：

第一个副本：存储在客户端所在节点（若客户端在集群外，则随机选择一个节点）；
第二个副本：存储在与第一个副本不同机架的节点上；
第三个副本：存储在与第二个副本同一机架的不同节点上。
这种策略既保证了数据的冗余性（单节点或机架故障不会导致数据丢失），又提高了读取效率（优先从本地或同机架读取）。

3. 元数据管理

NameNode通过命名空间（Namespace）维护文件系统的逻辑结构（目录树、文件属性），并通过映射表记录每个数据块与DataNode的对应关系。元数据的变更（如文件创建、删除）会记录到编辑日志（edits log）中，而文件系统的完整镜像则保存为fsimage文件。Secondary NameNode定期合并这两个文件，防止编辑日志过大。

四、数据可靠性保障

副本机制：默认3副本策略，确保单节点或机架故障时数据仍可访问；
心跳检测：DataNode定期向NameNode发送心跳（默认3秒一次），若NameNode超过10分钟未收到心跳，则认为该节点失效，立即启动副本恢复流程（在其他健康节点上复制副本）；
数据校验：读取数据时，客户端可验证数据块的校验和（Checksum），若校验失败，自动从其他副本读取，确保数据完整性。

0 赞

0 踩