如何用Linux strings查找重复字符串 - 问答

在 Linux 中，strings 命令用于从二进制文件中提取可打印的字符串。如果你想查找重复的字符串，可以结合使用 strings 和其他命令，如 sort 和 uniq。以下是一个基本的步骤指南：

提取字符串：使用 strings 命令从一个或多个文件中提取可打印的字符串。例如：
```
strings filename > strings_output.txt
```
排序字符串：使用 sort 命令对提取出的字符串进行排序。这有助于将相同的字符串排列在一起：
```
sort strings_output.txt > sorted_strings.txt
```
查找重复的字符串：使用 uniq 命令来查找重复的行。uniq 默认会删除重复行，但使用 -d 选项可以只显示重复出现的行：
```
uniq -d sorted_strings.txt
```
（可选）统计重复次数：如果你还想知道每个重复字符串出现了多少次，可以使用 uniq -c 选项，它会显示每个重复行的出现次数：
```
uniq -c sorted_strings.txt
```

你可以将上述步骤结合成一个命令行，以便快速查找重复字符串：

strings filename | sort | uniq -d

或者，如果你想同时看到每个重复字符串的出现次数：

strings filename | sort | uniq -c

strings 命令默认会提取长度至少为 4 的连续可打印字符。你可以使用 -n 选项来指定最小长度，例如 strings -n 6 filename 将提取长度至少为 6 的字符串。
对于大型文件，这些命令可能会消耗较多的内存和处理时间，因此请谨慎使用。

通过这些步骤，你应该能够有效地在二进制文件中查找重复的字符串。

0 赞

0 踩