Hadoop在Linux上的存储管理实现

一、HDFS架构：存储管理的核心框架

Hadoop在Linux上的存储管理通过Hadoop分布式文件系统（HDFS）实现，其核心是主从架构：

NameNode（主节点）：负责管理文件系统的元数据（包括文件名、目录结构、数据块位置、副本策略等），是HDFS的“大脑”。元数据通过**FsImage（镜像文件）和EditsLog（操作日志）**持久化，确保重启后恢复一致性。
DataNode（从节点）：分布在各Linux节点上，负责实际数据块的存储（默认128MB/块），并定期向NameNode发送心跳（默认3秒）和块报告（汇报存储的块列表），证明自身存活。
Secondary NameNode（辅助节点）：并非NameNode的热备，而是定期合并FsImage和EditsLog（如每小时或每100万次操作），生成新的FsImage，减轻NameNode的日志压力，避免日志过大导致性能下降。

HDFS的数据存储遵循“分块-分配-复制”的流程：

客户端发起请求：客户端向NameNode提交文件上传/下载请求，NameNode验证权限（如用户是否有写入权限）。
数据分块：NameNode返回可用的DataNode列表，客户端将文件分割成固定大小的数据块（默认128MB，可通过dfs.block.size调整）。
副本分配与写入：客户端以pipeline方式（流水线）将数据块依次写入DataNode。例如，3副本场景下，第一个DataNode接收数据后，立即转发给第二个，第二个转发给第三个，每个节点写入完成后发送ACK确认，确保数据完整性。
元数据更新：DataNode写入成功后，向NameNode报告块位置，NameNode更新元数据（如/user/data/file1的块列表及位置）。

HDFS通过多副本（默认3副本）实现数据冗余，即使某节点故障，仍可从其他副本读取数据。副本放置策略遵循机架感知（Rack Awareness）：

心跳机制：DataNode每3秒向NameNode发送心跳，NameNode若超过10分钟未收到某DataNode的心跳，判定其为“死亡”，触发副本重建流程（从其他副本复制数据到健康节点）。
块报告：DataNode定期（如每天）向NameNode发送块报告，汇报所有存储的块列表，NameNode据此维护全局块映射表（File->Block->DataNode），确保元数据与实际存储一致。

HDFS对每个数据块进行**校验和（Checksum）**计算（默认使用CRC32），存储时将校验和与数据块一起保存。读取数据时，客户端会验证校验和，若发现不一致，自动从其他副本读取，确保数据完整性。

HDFS的存储行为通过配置文件调整，关键参数包括：

副本数：dfs.replication（默认3，生产环境建议保持3，关键数据可调整为5）；
块大小：dfs.block.size（默认128MB，大文件建议256MB以减少元数据开销，小文件建议64MB以提高并行度）；
NameNode元数据目录：dfs.namenode.name.dir（指定本地路径或NFS，建议冗余备份，如file:/data/dfs/name1,file:/mnt/nfs/name）；
DataNode数据目录：dfs.datanode.data.dir（指定多个本地路径，如file:/data/dfs/data1,file:/data/dfs/data2，提高磁盘利用率）。

Hadoop提供了丰富的命令行工具管理HDFS存储：

查看文件块信息：hdfs fsck /path/to/file -files -blocks -locations（显示文件的块分布及存储节点）；
上传/下载文件：hadoop fs -put localfile /hdfs/path/（上传）、hadoop fs -get /hdfs/path/file localdir/（下载）；
创建/删除目录：hadoop fs -mkdir /hdfs/dir（创建）、hadoop fs -rm -r /hdfs/dir（递归删除）；
调整副本数：hadoop fs -setrep -w 5 /hdfs/file（将文件的副本数调整为5，-w表示等待完成）。

HOT（默认）：存储在DISK或SSD（适合热数据，如近期日志）；
COLD：存储在ARCHIVE（适合冷数据，如历史归档）；
ALL_SSD：强制使用SSD（适合高性能计算场景）。
通过hdfs storagepolicies -setStoragePolicy -path /hot_data -policy HOT命令设置。

0 赞

0 踩