distcp命令:通过hadoop distcp将HDFS数据从一个集群复制到另一个集群,实现跨集群备份。hdfs dfsadmin -createSnapshot命令为目录创建只读快照,快速备份数据。core-site.xml)暂存删除文件,可从中恢复误删数据。hdfs dfs -cp复制全部数据,增量备份仅复制变化数据,需结合脚本自动化。hdfs dfsadmin -saveNamespace保存元数据,用于恢复集群状态。.Trash/Current目录用hdfs dfs -mv命令还原误删文件。hdfs dfs -cp从快照目录复制文件到目标路径。hdfs dfs -put或DistCp命令复制回原位置。DistCp跨集群恢复数据,或通过fsck工具修复文件系统错误。参考来源:[1,3,4,5,6,7,8,9,10,11]