如何从 Linux 中的排序文件中删除重复的行?
为了从排序文件中删除重复行并使其唯一,我们在Linux系统中使用uniq命令。uniq命令用作一种过滤程序,可以报告文件中的重复行。它从输入中过滤相邻的匹配行并给出唯一的输出。此命令也可用于Windows和IBMi操作系统。
语法
uniq命令的一般语法如下
uniq [OPTION]... [INPUT [OUTPUT]]
fmt命令中可用选项的简要说明。
显示一行重复了多少次。
只显示重复的行,每组一个。
显示所有重复的行。
避免比较前N个字段。
比较时忽略大小写差异。
避免比较前N个字符。
只打印唯一的行
行分隔符为NULL,不是换行符
比较不超过N个字符。
显示帮助并退出。
输出版本信息并退出。
为了在删除文件中的重复行后打印,我们在Linux系统中使用uniq命令,如下所示。
$ cat >text.txt Print only unique lines. The earth is round. The earth is round. Welcome to the tutorialpoint... Welcome to the tutorialspint... $ uniq text.txt Print only unique lines. The earth is round. Welcome to the tutorialpoint...
要打印文件的重复行数,我们将-c或--count选项与unique命令一起使用,如下所示。
$ uniq –c text.txt 2 The earth is round. 2 Welcome to the nhooo... 1 Print only unique lines.
要仅打印文件的唯一行,我们将-u或–unique选项与uniq命令一起使用,如下所示。
$ uniq –u text.txt Print only unique lines.
要查看有关uniq命令的更多信息,我们在Linux操作系统中将--help选项与uniq命令一起使用,如下所示。
$ uniq --help
要查看uniq命令的版本信息,我们在Linux操作系统中将--version选项与uniq命令一起使用,如下所示。
$ uniq --version