本篇介紹如何使用 Linux 的 grep 指令,根據關鍵字或正規表示法找出想要的資料。
Linux 的 grep 是一個很好用的指令,可以從串流資料或檔案中,使用關鍵字或正規表示法(regular expression)篩選出想要尋找的資料,並且顯示出來,以下是 grep 的用法教學以及實際範例。
grep 這個指令名稱其實是來自於正規表示法的 g/RE/p,其意義是代表以正規表示法全域搜尋並列印出來(globally search for RE and print it)。grep 最基本的用法就是以普通的關鍵字來搜尋,其基本語法如下:
grep 關鍵字 檔案1 檔案2 ...
例如在 /etc/os-release 檔案中搜尋 Ubuntu 關鍵字:
# 在 /etc/os-release 檔案中搜尋 Ubuntu 關鍵字
grep Ubuntu /etc/os-release
NAME="Ubuntu" PRETTY_NAME="Ubuntu 18.04.3 LTS"
執行的結果會列出所有含有關鍵字的整行文字。
grep 亦可搭配萬用字元(*)同時搜尋多個檔案,例如在 /etc/ 目錄之下所有 *.conf 檔案中,尋找 network 這個字眼:
# 在 /etc/*.conf 中搜尋 network 關鍵字
grep network /etc/*.conf
ltrace.conf:hex(uint) inet_network(string); nsswitch.conf:networks: files sysctl.conf:# Additional settings - these settings can improve the network sysctl.conf:# security of the host and prevent against some network attacks sysctl.conf:# redirection. Some network environments, however, require that these
搜尋多個檔案時,在輸出中會標示資料來源是哪一個檔案。
除了搜尋檔案內容之外,亦可搭配管線(pipe)篩選串流資料,例如篩選出含有 network 關鍵字的檔案名稱:
# 篩選含有 network 關鍵字的檔案名稱
ls /etc/ | grep network
network networkd-dispatcher networks
grep 預設會區分字母的大小寫,如果希望以不分大小寫的方式搜尋,可以加上 -i 參數:
# 不分大小寫 grep -i Ubuntu /etc/os-release
若要標示匹配文字的行號,可以加上 -n 參數:
# 標示行號 grep -n Ubuntu /etc/os-release
1:NAME="Ubuntu" 5:PRETTY_NAME="Ubuntu 18.04.3 LTS"
若想要將匹配的資料排除,只顯示出沒有關鍵字的那幾行資料,可以加上 -v 參數。例如顯示不包含 Ubuntu 關鍵字的那幾行:
# 顯示不包含 Ubuntu 關鍵字的行 grep -v Ubuntu /etc/os-release
如果想要在指定目錄與其子目錄下所有的檔案中,搜尋指定的關鍵字,可以加上 -r 參數:
# 在 /etc/ 下所有檔案中搜尋 ubuntu grep -r ubuntu /etc/
如果只想要從特定的檔案中尋找關鍵字,可以使用 -r 搭配 --include 指定檔案類型:
# 在所有 *.conf 中尋找 ubuntu grep -r --include="*.conf" ubuntu /etc/
如果自己的權限沒辦法讀取所有的檔案,就會出現某些檔案無法讀取的錯誤訊息,這時候可以將這種錯誤訊息導向 /dev/null,只看正常訊息就好:
# 不顯示錯誤訊息 grep -r ubuntu /etc/ 2>/dev/null
有時候只顯示匹配成功那一行,不容易看出是否是我們想要找的資料,這時候可以加上 -A(After)、-B(Before)或-C(Context),指定要顯示的前後行數:
# 多顯示後一行 grep -A 1 Ubuntu /etc/os-release # 多顯示前一行 grep -B 1 Ubuntu /etc/os-release # 多顯示前後各一行 grep -C 1 Ubuntu /etc/os-release
grep 可以使用顏色標示的方式,將成功匹配的部分文字標示出來,方便使用者閱讀。顏色標示功能可以透過 --color=never、--color=always、--color=auto 這幾種參數來關閉、開啟或設為自動。開啟顏色標示的輸出會像這樣:
grep 在搜尋關鍵字時,其實是以正規表示法的方式匹配文字的,所以一般的正規表示法都可以直接使用,以下是一些常用的範例。開頭與結尾是最常用的:
# a 開頭 ls | grep "^a" # b 結尾 ls | grep "b$" # a 或 b 開頭 ls | grep "^[ab]" # a 或 b 結尾 ls | grep "[ab]$"
各種出現次數的指定:
# a 開頭,接著 b 出現零次以上 ls | grep "^ab*" # a 開頭,接著 b 出現零次或一次 ls | grep "^ab?" # a 開頭,接著 b 出現一次以上 ls | grep "^ab+"
多種字眼的組合,也很常用:
# 含有 ab 或 cd ls | grep "ab|cd" # 含有 ab 或 cd(另一種寫法,作用相同) ls | grep -E "ab|cd"
如果只想要精準篩選出 net 這個單字,可以這樣寫:
# 含有 net 這個單字 ls | grep "<net>"
issue.net
這樣就只會出現含有 net 這一個單字的結果,像是 network 這樣的字眼就會被排除。