在CentOS上配置HDFS时,有几个技巧可以帮助你更高效地完成配置过程。以下是一些有用的技巧:
查看当前机器名字:
hostname
命令hostnamectl
命令/etc/hostname
文件内容设置当前机器名字:
hostnamectl set-hostname hadoop1
查看当前机器的IP:
ip addr
命令ifconfig
命令。/etc/profile
文件,添加以下内容:export JAVA_HOME=/usr/java/default
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
source /etc/profile
生成SSH密钥:
ssh-keygen -t rsa
拷贝公钥到其他节点:
ssh-copy-id slave1
ssh-copy-id slave2
ssh-copy-id slave3
ssh-copy-id slave4
修改 core-site.xml
:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/data</value>
</property>
</configuration>
修改 hdfs-site.xml
:
<configuration>
<property>
<name>dfs.namenode.name.dir</name>
<value>/home/hadoop/data/namenode</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/home/hadoop/data/datanode</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>
hdfs balancer
命令:hdfs balancer -threshold 10 -idleiterations 5
-threshold
:数据节点之间磁盘使用率的相差阈值,取值范围0-100。-idleiterations
:迭代次数,默认为5。关闭防火墙:
systemctl stop firewalld
chkconfig iptables off
关闭SELinux:
vi /etc/selinux/config
SELINUX=disabled
vi /etc/sysconfig/network-scripts/ifcfg-eth0
BOOTPROTO
为 static
IPADDR
、GATEWAY
和 NETMASK
。hdfs namenode -format
通过以上技巧,你可以更高效地在CentOS上配置HDFS,确保集群的稳定性和高效性。