| 語(yǔ)法 | 意義 | 說(shuō)明 |
| "." | 任意字符 | |
| "^" | 字符串開(kāi)始 | '^hello'匹配'helloworld'而不匹配'aaaahellobbb' |
| "$" | 字符串結(jié)尾 | 與上同理 |
| "*" | 0 個(gè)或多個(gè)字符(貪婪匹配) | <*>匹配<title>chinaunix</title> |
| "+" | 1 個(gè)或多個(gè)字符(貪婪匹配) | 與上同理 |
| "?" | 0 個(gè)或多個(gè)字符(貪婪匹配) | 與上同理 |
| *?,+?,?? | 以上三個(gè)取第一個(gè)匹配結(jié)果(非貪婪匹配) | <*>匹配<title> |
| {m,n} | 對(duì)于前一個(gè)字符重復(fù)m到n次,{m}亦可 | a{6}匹配6個(gè)a、a{2,4}匹配2到4個(gè)a |
| {m,n}? | 對(duì)于前一個(gè)字符重復(fù)m到n次,并取盡可能少 | ‘a(chǎn)aaaaa'中a{2,4}只會(huì)匹配2個(gè) |
| "http://" | 特殊字符轉(zhuǎn)義或者特殊序列 | |
| [] | 表示一個(gè)字符集 | [0-9]、[a-z]、[A-Z]、[^0] |
| "|" | 或 | A|B,或運(yùn)算 |
| (...) | 匹配括號(hào)中任意表達(dá)式 | |
| (?#...) | 注釋,可忽略 | |
| (?=...) | Matches if ... matches next, but doesn't consume the string. | '(?=test)' 在hellotest中匹配hello |
| (?!...) | Matches if ... doesn't match next. | '(?!=test)' 若hello后面不為test,匹配hello |
| (?<=...) | Matches if preceded by ... (must be fixed length). | '(?<=hello)test' 在hellotest中匹配test |
| (?<!...) | Matches if not preceded by ... (must be fixed length). | '(?<!hello)test' 在hellotest中不匹配test |
| 特殊序列符號(hào) | 意義 |
| /A | 只在字符串開(kāi)始進(jìn)行匹配 |
| /Z | 只在字符串結(jié)尾進(jìn)行匹配 |
| /b | 匹配位于開(kāi)始或結(jié)尾的空字符串 |
| /B | 匹配不位于開(kāi)始或結(jié)尾的空字符串 |
| /d | 相當(dāng)于[0-9] |
| /D | 相當(dāng)于[^0-9] |
| /s | 匹配任意空白字符:[/t/n/r/r/v] |
| /S | 匹配任意非空白字符:[^/t/n/r/r/v] |
| /w | 匹配任意數(shù)字和字母:[a-zA-Z0-9] |
| /W | 匹配任意非數(shù)字和字母:[^a-zA-Z0-9] |
3.re的主要功能函數(shù)
常用的功能函數(shù)包括:compile、search、match、split、findall(finditer)、sub(subn)
compile
re.compile(pattern[, flags])
作用:把正則表達(dá)式語(yǔ)法轉(zhuǎn)化成正則表達(dá)式對(duì)象
flags定義包括:
re.I:忽略大小寫(xiě)
re.L:表示特殊字符集 /w, /W, /b, /B, /s, /S 依賴于當(dāng)前環(huán)境
re.M:多行模式
re.S:' . '并且包括換行符在內(nèi)的任意字符(注意:' . '不包括換行符)
re.U: 表示特殊字符集 /w, /W, /b, /B, /d, /D, /s, /S 依賴于 Unicode 字符屬性數(shù)據(jù)庫(kù)
search
re.search(pattern, string[, flags])
search (string[, pos[, endpos]])
作用:在字符串中查找匹配正則表達(dá)式模式的位置,返回 MatchObject 的實(shí)例,如果沒(méi)有找到匹配的位置,則返回 None。
match
re.match(pattern, string[, flags])
match(string[, pos[, endpos]])
作用:match() 函數(shù)只在字符串的開(kāi)始位置嘗試匹配正則表達(dá)式,也就是只報(bào)告從位置 0 開(kāi)始的匹配情況,而 search() 函數(shù)是掃描整個(gè)字符串來(lái)查找匹配。如果想要搜索整個(gè)字符串來(lái)尋找匹配,應(yīng)當(dāng)用 search()。
下面是幾個(gè)例子:
例:最基本的用法,通過(guò)re.RegexObject對(duì)象調(diào)用
說(shuō)明一下:r是raw(原始)的意思。因?yàn)樵诒硎咀址杏幸恍┺D(zhuǎn)義符,如表示回車(chē)'/n'。如果要表示/表需要寫(xiě)為'//'。但如果我就是需要表示一個(gè)'/'+'n',不用r方式要寫(xiě)為:'//n'。但使用r方式則為r'/n'這樣清晰多了。
例:設(shè)置flag
split
re.split(pattern, string[, maxsplit=0, flags=0])
split(string[, maxsplit=0])
作用:可以將字符串匹配正則表達(dá)式的部分割開(kāi)并返回一個(gè)列表
例:簡(jiǎn)單分析ip
findall
re.findall(pattern, string[, flags])
findall(string[, pos[, endpos]])
作用:在字符串中找到正則表達(dá)式所匹配的所有子串,并組成一個(gè)列表返回
例:查找[]包括的內(nèi)容(貪婪和非貪婪查找)
finditer
re.finditer(pattern, string[, flags])
finditer(string[, pos[, endpos]])
說(shuō)明:和 findall 類似,在字符串中找到正則表達(dá)式所匹配的所有子串,并組成一個(gè)迭代器返回。同樣 RegexObject 有:
sub
re.sub(pattern, repl, string[, count, flags])
sub(repl, string[, count=0])
說(shuō)明:在字符串 string 中找到匹配正則表達(dá)式 pattern 的所有子串,用另一個(gè)字符串 repl 進(jìn)行替換。如果沒(méi)有找到匹配 pattern 的串,則返回未被修改的 string。Repl 既可以是字符串也可以是一個(gè)函數(shù)。
例:
subn
re.subn(pattern, repl, string[, count, flags])
subn(repl, string[, count=0])
說(shuō)明:該函數(shù)的功能和 sub() 相同,但它還返回新的字符串以及替換的次數(shù)。同樣 RegexObject 有:
新聞熱點(diǎn)
疑難解答
圖片精選