以下是在CentOS上进行HDFS数据迁移的常用技巧及工具:
-update
参数)和保留文件属性(-p
参数)。hadoop fs -cp
(复制)、-mv
(移动)、-put
/-get
(本地与集群间传输)。hdfs dfs -du -h
查看源数据规模,规划分批迁移策略。hdfs dfs -tar
打包或rsync
工具备份关键数据。hadoop distcp hdfs://源集群:端口/路径 hdfs://目标集群:端口/路径
,可添加-overwrite
覆盖或-update
增量复制。hadoop fs -put
将数据从本地上传至集群,或-get
下载到本地。hdfs dfs -ls
或hdfs dfsadmin -report
。hadoop fs -ls -d
查看权限。-bandwidth
参数限制传输速度。参考来源: