使用命令行工具回收重复文件
命令行工具是Ubuntu下回收重复文件的高效方式,适合熟悉终端操作的用户,常用工具包括fdupes、rdfind、find+md5sum组合等。
安装:通过Ubuntu软件仓库安装,命令为sudo apt install fdupes。
查找重复文件:使用-r(递归)选项扫描指定目录,例如扫描~/Documents目录:fdupes -r ~/Documents。输出会按组列出重复文件,每组以空行分隔。
交互式删除:添加-d选项进入交互模式,fdupes会提示你选择每组中要保留的文件(输入编号)或删除所有重复项:fdupes -r -d ~/Documents。
自动删除(保留第一个):结合-N选项自动删除重复文件(保留每组第一个),命令为fdupes -r -N ~/Documents。注意:此操作不可逆,建议先备份重要数据。
安装:通过sudo apt install rdfind安装。
查找重复文件:直接扫描目标目录,例如rdfind ~/Pictures,结果会显示重复文件的路径。
模拟运行(查看重复项):使用-dryrun true选项,仅显示重复文件而不执行删除:rdfind -dryrun true ~/Pictures。
用硬链接替换重复项:硬链接可节省空间且不影响文件访问,命令为rdfind -makehardlinks true ~/Pictures。
删除重复项:使用-deleteduplicates true选项直接删除重复文件(保留第一个):rdfind -deleteduplicates true ~/Pictures。
原理:通过计算文件的MD5哈希值(内容唯一标识)识别重复文件,适合需要精准比对的场景。
步骤:
find /path/to/search -type f -exec md5sum {} + | sort > hashes.txt。sort hashes.txt | uniq -d,输出重复的哈希值。sort hashes.txt | uniq -d | cut -d' ' -f3- | xargs rm -v。注意:执行前务必确认文件路径,避免误删。安装:通过sudo apt install rmlint安装。
基本用法:扫描目录并生成报告,例如rmlint ~/Music,报告会保存在./rmlint.sh。
生成删除脚本:使用-o选项生成删除脚本(如sh格式),然后执行脚本:rmlint -o sh ~/Music && ./rmlint.sh。
多线程加速:rmlint自动检测CPU核心数,无需额外配置即可加速扫描,适合大规模文件去重。。
使用图形界面工具回收重复文件
若更习惯图形操作,可选择以下工具,操作更直观:
安装:通过sudo apt install fslint安装。
运行:在终端输入fslint-gui启动图形界面。
查找重复文件:选择目标目录,点击“Duplicates”标签,工具会自动扫描并列出重复文件组。
删除重复文件:选中要删除的文件,点击“Delete”按钮即可。建议先勾选“Dry run”(模拟运行)确认结果。。
安装:添加PPA仓库后安装,命令为sudo add-apt-repository ppa:dupeguru/ppa && sudo apt update && sudo apt install dupeguru-se。
运行:在应用菜单中找到“dupeGuru”并启动。
查找重复文件:添加目标目录,选择文件类型(如文档、图片),点击“Search”开始扫描。
删除重复文件:选中重复文件组,点击“Delete”按钮,选择保留的文件即可。支持正则表达式过滤,适合复杂场景。。
注意事项
~/Test)中尝试,熟悉工具的操作流程后再处理系统文件。。