一天一个shell命令 文本操作系列-comm命令用法
comm命令比较两个已排序文件每行数据的差异,并将其结果显示出来,如果没有指定任何参数,comm命令读取这两个文件,然后生成三列输出:1>仅在file1中出现的行2>仅在file2中出现的行3>在两个文件中都存在的行。
如果为文件名之一指定-(减号),则comm命令会从标准输入设备读取数据。
题外话:说到比较文件,过来人都用过BeyondCompare,老版本时候,我们只能右键选中用于比较的文件,再选中被比较文件,对比。如今他有了丰富的界面,支持linux上比较文件。干什么用的?svn管理不善的时候,版本控制做的不好的时候,你就会期望他了。这都是经验--!
回到正题:在shell中,也有个这么个命令---comm。comm可用于两个文件之间的比较。可以用于文件的比较,交集,求差以及差集操作。
这个定义其实不够详细,应该是comm逐行比较已排序的文件1和文件2.
全称:
(惭愧)没有找到合适的全称。com很明显是compare开头,m为mode。望高手指正。
查看—help
用法:comm[选项]...文件1文件2
逐行比较已排序的文件文件1和文件2。
如果不附带选项,程序会生成三列输出。第一列包含文件1特有的行,第二列包含文件2特有的行,而第三列包含两个文件共有的行。
-1 不输出文件1特有的行
-2 不输出文件2特有的行
-3 不输出两个文件共有的行
--check-order 检查输入是否被正确排序,即使所有输入行均成对
--nocheck-order 不检查输入是否被正确排序
--output-delimiter=STR 依照STR分列
解读:
1.--check-order
该命令默认情况下 如果希望不检验排序,可以--nocheck-order。
2.--output-delimiter=STR
STR就是个表达式。可以是任何非特殊字符
3.-1,-2
可以写成-12与普通命令用起来一样
实例:
1.建立A.txt
加入元素
apple
orange
gold
silver
steel
iron
2.建立B.txt
加入元素
orange
gold
cookies
carrot
可以尝试直接比较:commA.txtB.txt
你会发现提示一个错误,没有排序。
3.排序
sortA.txt-oA.txt;sortB.txt-oB.txt
4.比较
$commA.txtB.txt
apple carrot cookies gold iron orange silver steel
结果实际为3列其中第一列是文件1特有-1表示删除第一列
第二列是文件2特有的 -2代表删除第二列
第三列代表共同有的 -3代表删除共有的列
4.1打印交集:
$comm–12A.txtB.txt
4.2打印两个文件中不同的行
$comm–3A.txtB.txt
补充个小修改,两列不好看,用sed删除行首的\t
$comm–3A.txtB.txt|sed's/^\t//'
实战:
comm在实战中,只会在一些非常特殊的场景中用到。比较简单,就不举例了。(笔者遇到的场景中,仍然坚持有更好的方案时候,不用这个命令,呵呵)。
本文出自“书生”博客