在CentOS系统中清理重复文件可以通过多种方法实现,以下是一些常用的步骤和工具:
fdupes工具安装fdupes:
sudo yum install fdupes
查找重复文件:
fdupes -r /path/to/search
-r选项表示递归搜索。
删除重复文件(谨慎操作):
fdupes -rdN /path/to/search
-N选项表示只显示重复的文件名,不实际删除。
-d选项表示删除重复文件,但会保留最新的一个。
-r选项表示递归搜索。
find和sort命令查找并排序文件:
find /path/to/search -type f -exec md5sum {} \; | sort
这条命令会查找指定路径下的所有文件,并计算它们的MD5哈希值,然后按哈希值排序。
查找重复的哈希值:
find /path/to/search -type f -exec md5sum {} \; | sort | uniq -d -w 32
-d选项表示显示重复的行,-w 32选项表示忽略前32个字符(通常是文件路径)。
删除重复文件(谨慎操作): 可以手动检查重复的文件并删除它们,或者使用脚本来自动化这个过程。
dedupe-cli工具安装dedupe-cli:
sudo yum install dedupe-cli
运行去重任务:
dedupe-cli -d /path/to/search -m 50 -r
-d指定数据目录,-m设置相似度阈值(0-100),-r表示递归搜索。
查看和删除重复文件:
根据dedupe-cli的输出,选择要删除的重复文件并手动删除。
-N选项来预览哪些文件会被删除,确认无误后再执行删除操作。通过以上方法,你可以有效地清理CentOS系统中的重复文件。