在Linux中,可以使用wordcount
命令或结合其他工具进行词频分析
方法一:使用wordcount
命令
cat input.txt | wc -w
这将输出文本中的单词总数。
cat input.txt | sort | uniq -c | sort -nr
这将输出按词频降序排列的结果,其中每行显示一个单词及其出现次数。
方法二:使用awk
命令
awk '{print $1}' input.txt | sort | uniq -c | sort -nr
这将输出按词频降序排列的结果,其中每行显示一个单词及其出现次数。
在这两种方法中,你可以根据需要修改输入文件名、排序选项等。这些命令适用于基本的词频分析任务。如果你需要更复杂的词频分析,可以考虑使用Python、Perl或其他编程语言编写自定义脚本。