在CentOS上配置HDFS时,有几个技巧可以帮助你更高效地完成配置过程。以下是一些有用的技巧:
查看当前机器名字:
hostname 命令hostnamectl 命令/etc/hostname 文件内容设置当前机器名字:
hostnamectl set-hostname hadoop1
查看当前机器的IP:
ip addr 命令ifconfig 命令。/etc/profile 文件,添加以下内容:export JAVA_HOME=/usr/java/default
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib:$JAVA_HOME/lib:$JAVA_HOME/lib/tools.jar
source /etc/profile
生成SSH密钥:
ssh-keygen -t rsa
拷贝公钥到其他节点:
ssh-copy-id slave1
ssh-copy-id slave2
ssh-copy-id slave3
ssh-copy-id slave4
修改 core-site.xml:
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://namenode:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/data</value>
    </property>
</configuration>
修改 hdfs-site.xml:
<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/data/namenode</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/data/datanode</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
</configuration>
hdfs balancer 命令:hdfs balancer -threshold 10 -idleiterations 5
-threshold:数据节点之间磁盘使用率的相差阈值,取值范围0-100。-idleiterations:迭代次数,默认为5。关闭防火墙:
systemctl stop firewalld
chkconfig iptables off
关闭SELinux:
vi /etc/selinux/config
SELINUX=disabled
vi /etc/sysconfig/network-scripts/ifcfg-eth0
BOOTPROTO 为 staticIPADDR、GATEWAY 和 NETMASK。hdfs namenode -format
通过以上技巧,你可以更高效地在CentOS上配置HDFS,确保集群的稳定性和高效性。