CentOS 上 HBase 备份与恢复实操指南
一 常用备份方法对比
| 方法 | 适用场景 | 优点 | 局限 |
|---|---|---|---|
| 快照 Snapshot | 单表/多表的时间点备份、快速回滚 | 创建快(记录元数据与 HFile 引用)、对线上影响小、支持克隆/回滚 | 依赖 HDFS 与表结构;跨集群/跨版本迁移需配合 Export/Import 或 DistCp |
| Export/Import | 小规模数据迁移、跨集群/跨版本恢复 | 兼容性好、可导出到本地或 HDFS、易于校验 | 全量 MR 作业,大数据量耗时与资源占用高 |
| DistCp 拷贝 HDFS 目录 | 同版本集群间快速迁移/灾备、整库/多表备份 | 并行高效、适合 TB 级数据、可跨集群 | 需停写或一致性窗口;恢复时覆盖风险需评估 |
| CopyTable | 小表或指定时间窗口的增量复制 | 基于 Scan 的增量、灵活 | 对线上有一定读压力;不适合大表全量 |
| 第三方 B&R 工具 | 企业级备份恢复、自动化与治理能力 | 功能完备、可编排与监控 | 依赖厂商生态与授权成本 |
| 以上方法均为 CentOS 上 HBase 常用做法,可按数据规模、RTO/RPO 与运维能力选择组合方案。 |
二 备份操作步骤
快照 Snapshot(推荐先做)
Export/Import(跨集群/跨版本或小规模)
DistCp 拷贝 HDFS 目录(同版本整库/多表)
三 恢复操作步骤
从快照恢复
从 Export/Import 恢复
从 DistCp 恢复
四 一致性、可用性与演练建议
五 常见故障的快速处置