扣丁學堂解析Linux求兩個文本文件的交集、差集、并集
2018-07-06 15:09:18
1658瀏覽
今天扣丁學堂小編整理一下關(guān)于Linux求兩個文本文件的交集、差集、并集的介紹,下面我們一起來看一下Linux培訓老師的解答吧。
一、交集
sorta.txtb.txt|uniq-d
二、并集
sorta.txtb.txt|uniq
三、差集
a.txt-b.txt:
sorta.txtb.txtb.txt|uniq-u
b.txt-a.txt:
sortb.txta.txta.txt|uniq-u
四、相關(guān)的解釋
使用sort可以將文件進行排序(sort排序是為了管道交給uniq進行處理,uniq只能處理相鄰的行),可以使用sort后面的參數(shù),例如-n按照數(shù)字格式排序,例如-i忽略大小寫,例如使用-r為逆序輸出等
uniq為刪除文件中重復的行,得到文件中唯一的行,參數(shù)-d表示的是輸出出現(xiàn)次數(shù)大于1的內(nèi)容;參數(shù)-u表示的是輸出出現(xiàn)次數(shù)為1的內(nèi)容;那么對于上述的求交集并集差集的命令做如下的解釋:
sorta.txtb.txt|uniq-d:將兩個文件進行排序,uniq使得兩個文件中的內(nèi)容為唯一的,使用-d輸出兩個文件中次數(shù)大于1的內(nèi)容,即是得到交集
sorta.txtb.txt|uniq:將兩個文件進行排序,uniq使得兩個文件中的內(nèi)容為唯一的,即可得到兩個文件的并集
sorta.txtb.txtb.txt|uniq-u:將兩個文件排序,最后輸出a.txtb.txtb.txt文件中只出現(xiàn)過一次的內(nèi)容,因為有兩個b.txt所以只會輸出只在a.txt出現(xiàn)過一次的內(nèi)容(b.txt的內(nèi)容至少出現(xiàn)兩次),即是a.txt-b.txt差集;對于b.txt-a.txt同理。
以上就是關(guān)于解析Linux求兩個文本文件的交集、差集、并集的詳細介紹,希望對小伙伴們有所幫助,想要了解更多內(nèi)容的小伙伴可以登錄扣丁學堂官網(wǎng)咨詢,扣丁學堂是專業(yè)的Linux培訓機構(gòu),不僅有專業(yè)的老師和與時俱進的課程體系,還有大量的
Linux視頻教程供學員觀看學習,想要參加
Linux培訓班的小伙伴快快行動吧??鄱W堂Linux技術(shù)交流群:422345477。
【關(guān)注微信公眾號獲取更多的學習資料】
查看更多關(guān)于“Linux培訓資訊”的相關(guān)文章>>
標簽:
Linux培訓Linux視頻教程
Linux在線學習
Linux在線視頻
Linux系統(tǒng)