正則表示式/介紹
外觀
< 正則表示式
正則表示式是一種表示字串匹配模式的方法。正則表示式可以用來定位和修改文字資料記錄中匹配特定模式的字串,它們通常用在操作文字資料的實用程式和程式語言中。正則表示式非常強大。
各種軟體應用程式使用正則表示式來定位、選擇或修改特定部分的文字。例如,正則表示式可以用來
- 將整個文字中的“snake”一詞替換為“serpent”
- 找到包含“fox”和“sheep”這兩個詞的同一行的文字
正則表示式由三種類型的元件組成
- 錨點用於指定模式相對於文字行的位置。
- 字元集用於匹配單個位置中的一個或多個字元。
- 修飾符用於指定字元集重複的次數。
正則表示式的語法在不同的應用程式中有所不同。例如,shell 使用一種稱為 shell 正則表示式的有限形式的正則表示式進行檔名替換,而 AWK 使用擴充套件正則表示式語法的超集。
正則表示式得到各種軟體工具的支援,包括命令列工具、純文字編輯器和程式語言。大多數這些工具都可以在各種計算平臺上使用,包括 Linux、Windows 和 Mac OS X。這些工具使用略微不同的語法風格。讓我們看看一些值得注意的工具。
使用正則表示式的工具列在下面
| 命令列 工具 |
純文字 編輯器 |
程式設計 語言 |
|---|---|---|
| grep | ed | .NET |
| egrep | vi | Awk |
| sed | Emacs | Java |
| Notepad++ | JavaScript | |
| Perl | ||
| PHP | ||
| Python | ||
| Ruby | ||
| Tcl |
正則表示式可以被認為是一個小程式,它可以找到或隔離更大文字集的子集。就像普通的計算機程式需要計算機來執行它一樣,正則表示式需要軟體應用程式來解釋它 - 賦予它意義。
例如,正則表示式可以用來告訴編輯器查詢“Chapter”一詞的下一個出現位置,後面跟著幾個空格和數字。或者你可以使用正則表示式來告訴 UNIX grep 命令只顯示檔案中包含“Wiki”一詞,後面跟著“Books”一詞或“pedia”詞語片段的行。在下一章中,我們將討論這些正則表示式的確切語法。