Linux/Macでcommコマンドを使って片方だけ・両方に存在する行を簡単に抽出する

なんとなしにネットサーフィンしていたところ、commコマンドというコマンドがあることを知ったのでどういったコマンドなのか調べてみた。
このコマンド、簡単に説明すると2つのファイルを比較して、片方だけにある行を1or2列目に、両方にある行を3列目に分割して出力してくれる、というコマンドだ。

最初から入っているので、そのまま使える。
なお、比較の際はファイルは文字列ソート(数字ソートだとダメらしい)されている必要があるらしい。

サンプルファイルを元に、実際にコマンドを実行した結果が以下。
1個目のファイルだけに存在する行は1列目、2個目のファイルのは2列目、共通行は3列目に出力される。
※空白行があると面倒なので削除している

[root@BS-PUB-CENT7-01 ~]# cat /tmp/test123_2

1111
2222


3333

33333

[root@BS-PUB-CENT7-01 ~]# cat /tmp/test123_3
1111

222


3333

33333

[root@BS-PUB-CENT7-01 ~]# diff <(sort /tmp/test123_2 | sed '/^$/d') <(sort /tmp/test123_3 | sed '/^$/d')
2c2
< 2222
---
> 222
[root@BS-PUB-CENT7-01 ~]# comm <(sort /tmp/test123_2 | sed '/^$/d') <(sort /tmp/test123_3 | sed '/^$/d')
                1111
        222
2222
                3333
                33333

このとき、「-○」で特定の列を除外して出力させることができるので、片方のファイルにしかない行や共通行だけを抽出することもできる。

[root@BS-PUB-CENT7-01 ~]# # 共通行だけ抽出
[root@BS-PUB-CENT7-01 ~]# comm -12 <(sort /tmp/test123_2 | sed '/^$/d') <(sort /tmp/test123_3 | sed '/^$/d')
1111
3333
33333
[root@BS-PUB-CENT7-01 ~]# # 1個目のファイルにだけ存在する行を抽出
[root@BS-PUB-CENT7-01 ~]# comm -23 <(sort /tmp/test123_2 | sed '/^$/d') <(sort /tmp/test123_3 | sed '/^$/d')
2222
[root@BS-PUB-CENT7-01 ~]# # 2個目のファイルにだけ存在する行を抽出
[root@BS-PUB-CENT7-01 ~]# comm -13 <(sort /tmp/test123_2 | sed '/^$/d') <(sort /tmp/test123_3 | sed '/^$/d')
222

そのほか、grepのように使うこともできるようだ。
fgrepと同じような動きなのだけど、速度的にはこっちのほうが早いらしい。なんでだろ。

[root@BS-PUB-CENT7-01 ~]# sort /tmp/test123_2 | sed '/^$/d'
1111
2222
3333
33333
[root@BS-PUB-CENT7-01 ~]# comm -12 <(sort /tmp/test123_2 | sed '/^$/d') <(echo 1111)
1111

なお、デフォルトだとデリミタはタブになっているが、「–output-delimiter=’～’」で設定が可能となっている。

Linux/Macでcommコマンドを使って片方だけ・両方に存在する行を簡単に抽出する

Trending Articles

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

[BD1080p]回復術士のやり直し　「第四話回復術士は、セツナを手に入れる！」

ドライブレコーダー「Audi UTR」の設定方法

大会4日目、男子団体準々決勝、準決勝結果 [第37回全国選抜高校テニス]

[吹奏楽団] 第32回福岡県吹奏楽コンクール　金賞受賞！

那覇市の飲食店　放火未遂容疑で従業員の女を逮捕

梶浦郁乃(東邦高校元マネージャー)今現在OLで彼氏(藤島健斗)とは交際は続いている?

2013年4月12日号　北海道銀行（4月1日付）

自宅で大麻を栽培容疑　愛媛の男を逮捕

10句作品　内村恭子　ケセラセラ

大阪・泉南イオンで飛び降り自殺とみられる転落事件が発生：ネットで拡散された理由とは

シャドウコピーの記憶域を設定するボリュームの制限について

ゴールデン・スランバー　ザ・ビートルズ　歌詞　和訳

自宅警備員2　-灰原家の血族-　攻略

真VV版：主人公（ナホビノ）のオススメスキル｜真・女神転生V Vengeance攻略

Fortigate の SSL-VPN を CLI で設定

サンタの創庫詐欺破産事件　無償譲り受けの被告に懲役２年６月求刑

第45回　京都府少年少女空手道選手権大会　組手競技（全少予選）結果

人気占い師・Sakkoが占う！今日のアナタの運勢と、ラッキーカラーは・・・

Na Palapalaiが歌うKa Ua Kipu`upu`uと歌詞