在CentOS上管理HDFS存储空间可从以下方面入手:
监控存储状态
df -h查看磁盘整体使用情况,hdfs dfs -df -h查看HDFS目录/文件占用情况。hdfs dfsadmin -report监控集群节点状态及存储使用量。清理无用数据
hdfs dfs -rm /path/to/file。fs.trash.interval设置文件保留时间,自动清理过期文件。优化存储配置
hdfs-site.xml中dfs.blocksize(如128MB/256MB)。hdfs dfs -setrep调整文件副本数,平衡存储成本与可靠性。io.compression.codecs参数。配额管理
hdfs dfsadmin -setSpaceQuota<大小> <目录>。hdfs dfsadmin -setQuota<数量> <目录>。数据生命周期管理
hdfs storage policies为目录指定存储策略(如COLD归档冷数据、ALL_SSD加速热数据)。扩展存储容量
系统级优化
noatime属性减少磁盘I/O。参考来源: