以下是在Ubuntu上高效配置HDFS的关键步骤和技巧:
# 修改hdfs-site.xml  
<property>  
  <name>dfs.blocksize</name>  
  <value>134217728</value> <!-- 128MB -->  
</property>  
<property>  
  <name>dfs.replication</name>  
  <value>2</value> <!-- 非关键数据可降低至2 -->  
</property>  
dfs.namenode.handler.count,默认10,可调整为30~50)。hadoop archive工具),减少NameNode元数据压力。# 启用Map输出压缩  
<property>  
  <name>mapreduce.map.output.compress</name>  
  <value>true</value>  
</property>  
<property>  
  <name>mapreduce.map.output.compress.codec</name>  
  <value>org.apache.hadoop.io.compress.SnappyCodec</value>  
</property>  
/etc/sysctl.conf,如增大vm.swappiness(建议10~30)以减少内存交换。参考来源: