ubuntu

Ubuntu Hadoop 数据如何恢复

小樊
41
2025-12-16 19:58:38
栏目: 智能运维

Ubuntu Hadoop 数据恢复指南

恢复路径总览

HDFS 层面恢复步骤

  1. 回收站恢复(最快)

    • 查看回收站:hdfs dfs -ls /user/<用户名>/.Trash/Current
    • 恢复到原路径:hdfs dfs -mv /user/<用户名>/.Trash/Current/<原路径> /<原路径>
    • 前提:已配置并生效 fs.trash.interval(单位:分钟,0 为关闭;若服务端启用,以服务端为准)。
  2. 快照恢复(最可靠)

    • 查看快照:hdfs dfs -ls /path/.snapshot
    • 单文件/目录回滚:hdfs dfs -cp /path/.snapshot/<快照名>/<目标> /path/
    • 整目录回滚:hdfs dfs -cp -r /path/.snapshot/<快照名> /path/
    • 前提:对该目录提前执行过 hdfs dfsadmin -allowSnapshot /path 并创建过快照。
  3. 元数据回滚(无回收站/快照时)

    • 立即停止集群写入(尤其是 NameNodeDataNode),避免新写入覆盖旧块。
    • 从备份中选取删除时间点之前的 fsimage(及对应 edits),在新环境或本机临时加载以导出所需数据;或基于 审计日志 精确确定时间点后选择镜像版本。
    • 恢复完成后按序回放 edits,校验一致性后再对外提供服务。
  4. 副本缺失/块损坏

    • 定位损坏块:hdfs fsck /path -files -blocks -locations
    • 尝试恢复租约/副本:hdfs debug recoverLease -path <文件> -retries <次数>
    • 若副本数配置为 1 且全部丢失,需评估业务影响后谨慎清理损坏块再重建。

操作系统或磁盘层面的恢复

备份与预防建议

风险提示

0
看了该问题的人还看了