在CentOS上管理HDFS存储空间可从以下方面入手:
监控存储状态
df -h
查看磁盘整体使用情况,hdfs dfs -df -h
查看HDFS目录/文件占用情况。hdfs dfsadmin -report
监控集群节点状态及存储使用量。清理无用数据
hdfs dfs -rm /path/to/file
。fs.trash.interval
设置文件保留时间,自动清理过期文件。优化存储配置
hdfs-site.xml
中dfs.blocksize
(如128MB/256MB)。hdfs dfs -setrep
调整文件副本数,平衡存储成本与可靠性。io.compression.codecs
参数。配额管理
hdfs dfsadmin -setSpaceQuota<大小> <目录>
。hdfs dfsadmin -setQuota<数量> <目录>
。数据生命周期管理
hdfs storage policies
为目录指定存储策略(如COLD
归档冷数据、ALL_SSD
加速热数据)。扩展存储容量
系统级优化
noatime
属性减少磁盘I/O。参考来源: