本文實例講述了Python松散正則表達式用法。分享給大家供大家參考,具體如下:
Python 允許用戶利用所謂的 松散正則表達式來完成這個任務。一個松散正則表達式和一個緊湊正則表達式主要區別表現在兩個方面:
1. 忽略空白符。空格符,制表符,回車符不匹配它們自身,他們根本不參與匹配。(如果你想在松散正則表達式中匹配一個空格符,你必須在它前面添加一個反斜線符號對他進行轉義)
2. 忽略注釋。在松散正則表達式中的注釋和在普通Python代碼中的一樣:開始于一個#符號,結束于行尾。這種情況下,采用在一個多行字符串中注釋,而不是在源代碼中注釋,他們以相同的方式工作。
下面是一個松散正則表達式的例子,直觀地看,正則表達式模式被分成好幾行來寫了,我們可以為每行配上我們的注釋。這樣在過段時間后回頭過來看我們可以很快地知道這個正則表達式的作用,增強代碼的可讀性。
>>> import re>>> pattern = """ ^ # beginning of string M{0,4} # thousands - 0 to 4 M's (CM|CD|D?C{0,3}) # hundreds - 900 (CM), 400 (CD), 0-300 (0 to 3 C's), # or 500-800 (D, followed by 0 to 3 C's) (XC|XL|L?X{0,3}) # tens - 90 (XC), 40 (XL), 0-30 (0 to 3 X's), # or 50-80 (L, followed by 0 to 3 X's) (IX|IV|V?I{0,3}) # ones - 9 (IX), 4 (IV), 0-3 (0 to 3 I's), # or 5-8 (V, followed by 0 to 3 I's) $ # end of string """>>> re.search(pattern, 'M', re.VERBOSE)<_sre.SRE_Match object at 0x01401570>>>> re.search(pattern, 'MCMLXXXIX', re.VERBOSE)<_sre.SRE_Match object at 0x014015C0>>>> re.search(pattern, 'M')>>> 使用松散正則表達式時必須傳遞另外一個參數re.VERBOSE,該參數是定義在re 模塊中的一個常量,標志著待匹配的正則表達式是一個松散正則表達式。Python 不能自動檢測一個正則表達式是為松散類型還是緊湊類型,所以必須顯式的標明一個正則表達式為松散類型。所以
re.search(pattern, 'M', re.VERBOSE)#松散正則表達式
跟:
re.search(pattern, 'M'))#默認為“緊湊”正則表達式
得到的結果就不一樣了。
下面是很常見的一些正則表達式:
^ 匹配字符串的開始。
$ 匹配字符串的結尾。
/b 匹配一個單詞的邊界。
/d 匹配任意數字。
/D 匹配任意非數字字符。
x? 匹配一個可選的x字符(換句話說,它匹配1次或者0次x 字符)。
x* 匹配0次或者多次x字符。
x+匹配1次或者多次x字符。
x{n,m} 匹配x字符,至少n次,至多m次。
(a|b|c)要么匹配a,要么匹配b,要么匹配c。
(x) 一般情況下表示一個記憶組(remembered group). 我們可以利用re.search函數返回對象的groups()函數獲取它的值。



















