CentOS下HDFS数据恢复主要有以下几种方法及步骤:
利用回收站恢复
core-site.xml中配置fs.trash.interval(如设置为120分钟)。/user/username/.Trash/Current/中用hdfs dfs -mv命令恢复文件。基于快照恢复
hdfs dfsadmin -allowSnapshot /path和hdfs dfs -createSnapshot /path snapshotName。hdfs dfs -restoreSnapshot /path snapshotName或hdfs dfs -cp /path/.snapshot/snapshotName /destination恢复。使用Hadoop工具恢复
hdfs fsck /path -files -blocks -locations。hadoop distcp hdfs://源集群路径 hdfs://目标集群路径。手动恢复(高风险)
sudo systemctl stop hadoop-namenode hadoop-datanode。fsimage文件到NameNode节点。注意事项:
引用来源: