HDFS数据压缩优化可从算法选择、配置参数、存储格式及监控调优等方面入手,具体如下:
hdfs-site.xml
中添加压缩算法配置,例如:<property>
<name>io.compression.codecs</name>
<value>org.apache.hadoop.io.compress.SnappyCodec,org.apache.hadoop.io.compress.BZip2Codec</value>
</property>
启用透明压缩时,设置dfs.compress=true
。