Ubuntu Hadoop数据备份方法如下:
hadoop fs -cp hdfs://源路径 hdfs://目标路径
。hadoop distcp hdfs://源路径 hdfs://目标路径
。hdfs dfsadmin -allowSnapshot /路径
。hdfs dfs -createSnapshot /路径 快照名
。hdfs dfs -revertSnapshot /路径 快照名
。sudo -u hdfs hdfs dfsadmin -safemode enter
sudo -u hdfs hdfs dfsadmin -saveNamespace
/dfs/nn/
目录下的文件复制到备份位置。cron
定时任务结合备份命令实现定期全量/增量备份,例如:crontab -e
添加 0 0 * * * hadoop distcp 源路径 目标路径 >> /var/log/backup.log 2>&1
。注意:备份前确保集群正常运行,定期验证备份数据的完整性和可恢复性。