hadoop100、hadoop200、hadoop300),安装Ubuntu 20.04及以上版本;sudo ufw disable)或开放必要端口(HBase默认端口:16010(Web UI)、16000(Master)、16020(RegionServer);Zookeeper默认端口:2181;Hadoop默认端口:9000(HDFS)、8032(YARN));hbase)操作,避免权限问题,配置SSH免密登录(ssh-keygen -t rsa生成密钥,ssh-copy-id user@remote分发到其他节点)。wget https://dlcdn.apache.org/hbase/2.4.11/hbase-2.4.11-bin.tar.gz;/usr/local目录:sudo tar -zxvf hbase-2.4.11-bin.tar.gz -C /usr/local/;sudo mv /usr/local/hbase-2.4.11 /usr/local/hbase。/etc/profile文件,添加以下内容:export HBASE_HOME=/usr/local/hbase
export PATH=$PATH:$HBASE_HOME/bin:$HBASE_HOME/sbin
source /etc/profile;hbase version,若显示版本信息则说明安装成功。$HBASE_HOME/conf目录)hbase-env.shJAVA_HOME注释并设置为JDK路径(如/usr/lib/jvm/java-8-openjdk-amd64);HBASE_MANAGES_ZK=false(使用外部Zookeeper,避免与HBase自带ZooKeeper冲突);export HBASE_CLASSPATH=/usr/local/hadoop/etc/hadoop(确保HBase能识别Hadoop集群);export HBASE_HEAPSIZE=4G(设置HBase最大堆内存)、export HBASE_OPTS="-XX:+UseG1GC"(使用G1垃圾回收器提升性能)。hbase-site.xml<property>
<name>hbase.cluster.distributed</name>
<value>true</value> <!-- 启用分布式模式 -->
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop100:9000/hbase</value> <!-- HDFS NameNode地址,需与Hadoop core-site.xml中的fs.defaultFS一致 -->
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop100,hadoop200,hadoop300</value> <!-- ZooKeeper集群节点列表 -->
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/usr/local/zookeeper/data</value> <!-- ZooKeeper数据存储目录 -->
</property>
<property>
<name>hbase.regionserver.handler.count</name>
<value>100</value> <!-- RegionServer处理请求的线程数,根据CPU核心数调整 -->
</property>
<property>
<name>hbase.hregion.max.filesize</name>
<value>10GB</value> <!-- Region最大文件大小,超过则触发split -->
</property>
regionservershadoop100
hadoop200
hadoop300
backup-masters(可选,高可用)backup-masters文件,添加备用Master主机名(如hadoop200),每行一个。hadoop100)执行:start-dfs.sh # 启动HDFS
start-yarn.sh # 启动YARN
zkServer.sh start
使用zkServer.sh status验证状态(Leader节点显示“Mode: leader”,Follower节点显示“Mode: follower”)。hadoop100)执行:start-hbase.sh
jps,应看到HMaster进程;在RegionServer节点执行jps,应看到HRegionServer进程。http://hadoop100:16010(Master节点IP:16010),查看集群状态、RegionServer列表、表信息等;hbase shell进入交互式命令行,输入list查看所有表(初始为空),输入status查看集群状态(显示“Cluster is ONLINE”则说明成功)。/usr/local/hbase、/home/hbase/hbasetsst/tmp)的权限正确,用户hbase对目录有读写权限:sudo chown -R hbase:hbase /usr/local/hbase。netstat -tulnp | grep 端口号查找占用进程,杀掉冲突进程或修改HBase配置文件中的端口。zkServer.sh status),以及hbase.zookeeper.quorum配置是否正确(需与Zookeeper集群节点列表一致)。create 'user_behavior', {NAME => 'cf1', NUMREGIONS => 10}),避免RegionServer热点问题;blockcache大小(hfile.block.cache.size,默认0.25),提升读取性能;COMPRESSION => 'SNAPPY'),减少磁盘IO;