在CentOS上进行HDFS数据迁移的步骤如下:
hdfs dfs -du -h /
查看各目录的总数据量,并按业务划分,统计各业务的数据总量。distcp
,通过简单的命令即可完成数据迁移。distcp
的 -update
参数来确保数据的一致性,它会在目标集群上更新已存在的文件。-p
参数保留文件的权限信息,确保迁移后的文件权限与源集群一致。使用 distcp
命令进行数据迁移,例如:
hadoop distcp hdfs://namenode:port/source/path hdfs://namenode:port/destination/path
如果需要复制整个目录,可以使用通配符:
hadoop distcp hdfs://namenode:port/source/directory hdfs://namenode:port/destination/directory
。