在Debian上进行Hadoop性能测试可按以下步骤操作:
安装Hadoop
core-site.xml
、hdfs-site.xml
等文件,确保集群参数正确。hdfs namenode -format
,启动Hadoop服务。安装测试工具
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-<版本>.jar TestDFSIO -write -nrFiles 10 -fileSize 100
(-nrFiles
为文件数量,-fileSize
为文件大小,单位MB)。hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-<版本>.jar TestDFSIO -read -nrFiles 10 -fileSize 100
结果保存在TestDFSIO_results.log
中,可查看吞吐量、耗时等指标。# 服务端
iperf -s
# 客户端
iperf -c <服务端IP>
(单位:Mbps)。ping <节点IP>
```。
run-hadoopbench.sh
,选择测试类型(如TeraSort、WordCount)。hadoop jar hibench.jar teragen 100000000 /input
hadoop jar hibench.jar terasort /input /output
hadoop jar hibench.jar teravalidate /output /result
。yarn-site.xml
的yarn.nodemanager.aux-services
参数。dfs.blocksize
)、副本数(dfs.replication
)。mapreduce.job.reduces
)。hibench.conf
。参考资料: