Debian中HBase数据迁移可参考以下方法,需根据集群网络环境和版本选择合适方案:
hadoop distcp
命令拷贝HDFS数据:hadoop distcp hdfs://source-cluster:8020/hbase/data/default/source_table hdfs://target-cluster:8020/hbase/data/default/
LoadIncrementalHFiles
加载数据:hbase org.apache.hadoop.hbase.mapreduce.LoadIncrementalHFiles hdfs://target-cluster:8020/hbase/data/default/ target_table
hbase org.apache.hadoop.hbase.mapreduce.CopyTable --peer.adr=target-cluster:2181:/hbase source_table
hbase org.apache.hadoop.hbase.mapreduce.Export source_table hdfs://target-cluster:8020/export_path
hbase org.apache.hadoop.hbase.mapreduce.Import target_table hdfs://target-cluster:8020/export_path
Export
将源集群数据导出到本地HDFS或临时存储。Import
将数据导入目标集群HDFS。LoadIncrementalHFiles
加载数据到目标表。以上方法均基于HBase原生工具,适用于Debian等Linux系统,具体操作前建议先在测试环境验证。