distcp
命令:通过hadoop distcp
将HDFS数据从一个集群复制到另一个集群,实现跨集群备份。hdfs dfsadmin -createSnapshot
命令为目录创建只读快照,快速备份数据。core-site.xml
)暂存删除文件,可从中恢复误删数据。hdfs dfs -cp
复制全部数据,增量备份仅复制变化数据,需结合脚本自动化。hdfs dfsadmin -saveNamespace
保存元数据,用于恢复集群状态。.Trash/Current
目录用hdfs dfs -mv
命令还原误删文件。hdfs dfs -cp
从快照目录复制文件到目标路径。hdfs dfs -put
或DistCp
命令复制回原位置。DistCp
跨集群恢复数据,或通过fsck
工具修复文件系统错误。参考来源:[1,3,4,5,6,7,8,9,10,11]