在CentOS上进行HDFS数据迁移的步骤如下:
hdfs dfs -du -h / 查看各目录的总数据量,并按业务划分,统计各业务的数据总量。distcp,通过简单的命令即可完成数据迁移。distcp 的 -update 参数来确保数据的一致性,它会在目标集群上更新已存在的文件。-p 参数保留文件的权限信息,确保迁移后的文件权限与源集群一致。使用 distcp 命令进行数据迁移,例如:
hadoop distcp hdfs://namenode:port/source/path hdfs://namenode:port/destination/path
如果需要复制整个目录,可以使用通配符:
hadoop distcp hdfs://namenode:port/source/directory hdfs://namenode:port/destination/directory
。