在Linux下怎么寻找相同的文件

发布时间:2021-10-26 09:47:09 作者:小新
来源:亿速云 阅读:103

小编给大家分享一下在Linux下怎么寻找相同的文件,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!


inode 是一个数据结构,记录了文件所有信息,除了文件名和文件内容。如果两个或多个文件具有相同的 inode 值,即使它们的文件名不一样,位置不一样,它们的内容、所有者、权限其实都是一样的,我们可以将其视有相同文件。

这类型的文件其实就是所谓的「硬链接」。硬链接具有相同的 inode 值,但文件名不一样。而软链接其实就是快捷方式,它指向目标文件,但有着自己的 inode 值。

$ ls -l my* 
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 myfile 
lrwxrwxrwx 1 liangxu liangxu     6 Apr 15 11:18 myref -> myfile 
-rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 mytwin

我们无法直接知道同一目录下有哪些文件是有相同的 inode 值,但要识别起来也不难。其实我们只要使用 ls -i  命令,再以 inode 值进行排序,就可以直接找到这些文件。

$ ls -i | sort -n | more 
 ... 
 788000 myfile    <== 
 788000 mytwin    <== 
 801865 Name_Labels.pdf 
 786692 never leave home angry 
 920242 NFCU_Docs 
 800247 nmap-notes

在这个结果的第一列里,就是对应的 inode 值。所以从这个结果里我们一眼就可以看出来,哪些文件具有相同 inode 值。

如果你只是想找到一个文件的对应硬链接文件,我们可以使用 find  命令,再加个 -samefile 选项即可快速找到。

$ find . -samefile myfile 
./myfile 
./save/mycopy 
./mytwin

这些文件都是有相同的 inode 值,不信的话可以再使用 ls 命令来查看更多信息:

$ find . -samefile myfile -ls 
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./myfile 
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./save/mycopy 
 788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./mytwin

我们可以看到,除了文件名之外,这几个文件名的信息完全一样。细心的朋友可能会注意到,在第2列(硬连接数)是4,而实际上我们找出来的文件只有3个,这说明还有一个文件与他们共享 inode 值,只是我们通过这条命令没有找出来而已。

作为一个懒人,每次敲命令多麻烦,直接上 脚本找出目录下的相同文件!

#!/bin/bash 
 
# seaches for files sharing inodes 
 
prev="" 
 
# list files by inode 
ls -i | sort -n > /tmp/$0 
 
# search through file for duplicate inode #s 
while read line 
do 
    inode=`echo $line | awk '{print $1}'` 
    if [ "$inode" == "$prev" ]; then 
        grep $inode /tmp/$0 
    fi 
    prev=$inode 
done < /tmp/$0 
 
# clean up 
rm /tmp/$0

运行结果:

$ ./findHardLinks 
 788000 myfile 
 788000 mytwin

当然了,你还可以使用 find 命令,根据 inode 值,找到系统里所有相同文件。

$ find / -inum 788000 -ls 2> /dev/null 
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /tmp/mycopy 
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/myfile 
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/save/mycopy 
 788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/mytwin

在这条命令里,我们将错误提示重定向到 /dev/null 这个特殊文件里,这样在搜索一些我们没有权限访问的路径时,不会满屏的 permission denied 。

以上是“在Linux下怎么寻找相同的文件”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注亿速云行业资讯频道!

推荐阅读:
  1. 在linux下打开python文件的方法
  2. 2019实用的Python运用技法总结:在两个字典中寻找相同点

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

linux

上一篇:如何用Python爬取排行榜上的游戏打折信息

下一篇:Python如何爬取高清桌面壁纸

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》