HBase与Hadoop在CentOS上的协同工作主要涉及安装、配置环境变量、修改配置文件以及启动服务。以下是一个基本的集成步骤指南:
安装Java环境:HBase依赖于Java环境,因此需要先安装Java。可以使用以下命令来检查Java是否已经安装:
java -version
如果系统中没有安装Java,可以使用以下命令来安装:
sudo yum install java-1.8.0-openjdk-devel
下载并解压Hadoop:从Apache Hadoop官网下载对应版本的Hadoop安装包,例如Hadoop 3.3.0。
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.0/hadoop-3.3.0.tar.gz
tar -xzvf hadoop-3.3.0.tar.gz
sudo mv hadoop-3.3.0 /usr/local/hadoop
编辑/etc/profile
文件,添加Hadoop的环境变量:
export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
使配置生效:
source /etc/profile
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
</configuration>
下载并解压HBase:从Apache HBase官网下载对应版本的HBase安装包,例如HBase 2.5.0。
wget https://downloads.apache.org/hbase/2.5.0/hbase-2.5.0-bin.tar.gz
tar -xzvf hbase-2.5.0-bin.tar.gz
sudo mv hbase-2.5.0 /usr/local/hbase
配置HBase环境变量:编辑/etc/profile
文件,添加HBase的环境变量:
export HBASE_HOME=/usr/local/hbase
export PATH=$PATH:$HBASE_HOME/bin
使配置生效:
source /etc/profile
修改HBase配置文件:
hbase-env.sh:
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk
export HBASE_MANAGES_ZK false
export HBASE_PID_DIR=/usr/local/hbase/pid
export HBASE_LOG_DIR=/usr/local/hbase/logs
hbase-site.xml:
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://localhost:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.master.port</name>
<value>16000</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>localhost</value>
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/usr/local/zookeeper/data</value>
</property>
</configuration>
修改regionservers文件:编辑/usr/local/hbase/conf/regionservers
文件,添加所有HBase节点的主机名。
hdfs namenode -format
./sbin/start-dfs.sh
./sbin/start-yarn.sh
./bin/start-hbase.sh
jps
命令检查Hadoop和HBase的进程是否正常运行。请注意,具体的版本和配置可能会因环境而异,建议参考官方文档进行详细配置。