要提升Linux上Hadoop的读写速度,可以从以下几个方面进行优化:
<property>
<name>dfs.blocksize</name>
<value>256M</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>mapreduce.map.memory.mb</name>
<value>4096</value>
</property>
<property>
<name>mapreduce.reduce.memory.mb</name>
<value>8192</value>
</property>
<property>
<name>mapreduce.job.locality.wait</name>
<value>300000</value>
</property>
net.core.somaxconn
和net.ipv4.tcp_max_syn_backlog
,以提高网络吞吐量。<property>
<name>mapreduce.output.fileoutputformat.compress</name>
<value>true</value>
</property>
<property>
<name>mapreduce.output.fileoutputformat.compress.codec</name>
<value>org.apache.hadoop.io.compress.SnappyCodec</value>
</property>
通过以上几个方面的优化,可以显著提升Linux上Hadoop的读写速度。