hadoop100
、hadoop200
、hadoop300
),安装Ubuntu 20.04及以上版本;sudo ufw disable
)或开放必要端口(HBase默认端口:16010(Web UI)、16000(Master)、16020(RegionServer);Zookeeper默认端口:2181;Hadoop默认端口:9000(HDFS)、8032(YARN));hbase
)操作,避免权限问题,配置SSH免密登录(ssh-keygen -t rsa
生成密钥,ssh-copy-id user@remote
分发到其他节点)。wget https://dlcdn.apache.org/hbase/2.4.11/hbase-2.4.11-bin.tar.gz
;/usr/local
目录:sudo tar -zxvf hbase-2.4.11-bin.tar.gz -C /usr/local/
;sudo mv /usr/local/hbase-2.4.11 /usr/local/hbase
。/etc/profile
文件,添加以下内容:export HBASE_HOME=/usr/local/hbase
export PATH=$PATH:$HBASE_HOME/bin:$HBASE_HOME/sbin
source /etc/profile
;hbase version
,若显示版本信息则说明安装成功。$HBASE_HOME/conf
目录)hbase-env.sh
JAVA_HOME
注释并设置为JDK路径(如/usr/lib/jvm/java-8-openjdk-amd64
);HBASE_MANAGES_ZK=false
(使用外部Zookeeper,避免与HBase自带ZooKeeper冲突);export HBASE_CLASSPATH=/usr/local/hadoop/etc/hadoop
(确保HBase能识别Hadoop集群);export HBASE_HEAPSIZE=4G
(设置HBase最大堆内存)、export HBASE_OPTS="-XX:+UseG1GC"
(使用G1垃圾回收器提升性能)。hbase-site.xml
<property>
<name>hbase.cluster.distributed</name>
<value>true</value> <!-- 启用分布式模式 -->
</property>
<property>
<name>hbase.rootdir</name>
<value>hdfs://hadoop100:9000/hbase</value> <!-- HDFS NameNode地址,需与Hadoop core-site.xml中的fs.defaultFS一致 -->
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>hadoop100,hadoop200,hadoop300</value> <!-- ZooKeeper集群节点列表 -->
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/usr/local/zookeeper/data</value> <!-- ZooKeeper数据存储目录 -->
</property>
<property>
<name>hbase.regionserver.handler.count</name>
<value>100</value> <!-- RegionServer处理请求的线程数,根据CPU核心数调整 -->
</property>
<property>
<name>hbase.hregion.max.filesize</name>
<value>10GB</value> <!-- Region最大文件大小,超过则触发split -->
</property>
regionservers
hadoop100
hadoop200
hadoop300
backup-masters
(可选,高可用)backup-masters
文件,添加备用Master主机名(如hadoop200
),每行一个。hadoop100
)执行:start-dfs.sh # 启动HDFS
start-yarn.sh # 启动YARN
zkServer.sh start
使用zkServer.sh status
验证状态(Leader节点显示“Mode: leader”,Follower节点显示“Mode: follower”)。hadoop100
)执行:start-hbase.sh
jps
,应看到HMaster
进程;在RegionServer节点执行jps
,应看到HRegionServer
进程。http://hadoop100:16010
(Master节点IP:16010),查看集群状态、RegionServer列表、表信息等;hbase shell
进入交互式命令行,输入list
查看所有表(初始为空),输入status
查看集群状态(显示“Cluster is ONLINE”则说明成功)。/usr/local/hbase
、/home/hbase/hbasetsst/tmp
)的权限正确,用户hbase
对目录有读写权限:sudo chown -R hbase:hbase /usr/local/hbase
。netstat -tulnp | grep 端口号
查找占用进程,杀掉冲突进程或修改HBase配置文件中的端口。zkServer.sh status
),以及hbase.zookeeper.quorum
配置是否正确(需与Zookeeper集群节点列表一致)。create 'user_behavior', {NAME => 'cf1', NUMREGIONS => 10}
),避免RegionServer热点问题;blockcache
大小(hfile.block.cache.size
,默认0.25),提升读取性能;COMPRESSION => 'SNAPPY'
),减少磁盘IO;