debian

Debian HBase如何进行故障恢复

小樊
32
2025-12-15 04:39:46
栏目: 智能运维

Debian 上 HBase 故障恢复实战指南

一 快速判断与恢复流程

二 常见故障与修复对照表

故障场景 典型现象 修复要点
RegionServer 宕机 进程异常退出,日志出现 ABORTING region serverlong GC pause 调整 HBASE_HEAPSIZE、优化 GC(如 G1GC);检查磁盘 I/O;必要时滚动重启异常 RS
Region 分配异常 hbase hbckRegion not deployed / should not be deployed 依次执行 hbase hbck -fixMetahbase hbck -fixAssignments 修复元数据与分配
Region 链空洞 hbase hbckThere is a hole in the region chain 先停写;在 HDFS 补齐缺失的 .regioninfo;执行 hbase hbck -fixHdfsHoles;仍失败则备份后重建表
HBase 启动失败 HMaster/RegionServer 无法启动,提示内存不足或端口占用 调整堆与内存参数;确认 ZooKeeper/HDFS 已启动;排查端口占用
一致性/完整性异常 hbase hbck 显示 Found inconsistency 停止 HBase;清理 ZooKeeper 中损坏的 ACL 表信息;重启后用 hbck -fix 系列修复
数据损坏或断电后异常 读写失败、META 异常 hdfs fsck / 判定损坏范围;必要时停集群;修复 .META. 与 Region 分配;再启动集群验证

以上为生产中最常见的故障模式与处置路径,优先使用 hbck 系列工具修复元数据与分配一致性,再考虑重启与重建。

三 标准恢复操作清单

四 备份与高可用建议

0
看了该问题的人还看了