Ubuntu HDFS迁移步骤如下:
迁移前准备
hdfs dfs -du -h /查看各目录数据量,按业务划分统计。distcp工具迁移。执行迁移
hadoop distcp hdfs://源集群:端口/路径 hdfs://目标集群:端口/路径。
hadoop distcp hdfs://nn1:8020/data hdfs://nn2:8020/。-p:保留文件权限、副本数等元数据。-bandwidth:限制迁移带宽(单位MB)。-update:更新目标集群已存在文件。迁移后校验
distcp -diff或对比文件列表检查。hdfs dfs -ls -d确认文件权限与源集群一致。注意事项:
参考来源: