国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

python 正則表達(dá)式 反斜杠(/)的麻煩和陷阱

2020-03-16 21:16:03
字體:
供稿:網(wǎng)友
這里是一點(diǎn)小心得。 由于正則表達(dá)式使用反斜杠來轉(zhuǎn)義特殊字符,而python自身處理字符串時,反斜杠也是用于轉(zhuǎn)義字符,這樣就產(chǎn)生了一個雙重轉(zhuǎn)換的問題
 
 
要匹配字符串中1個反斜杠應(yīng)該怎么寫正則表達(dá)式?"//",這樣行嗎?試試就知道了,re模塊拋異常了,因?yàn)?quot;//"就是一個反斜杠,對于正則表達(dá)式解析器來說,是一個轉(zhuǎn)義字符,但是后面啥也沒有,自然就報錯了,"///"三個肯定是不行的,試試四個"////",完美匹配。 
復(fù)制代碼代碼如下:

import re 
re_str_patt = "////" 
reObj = re.compile(re_str_patt) 
str_test = "abc//cd//hh" 
print reObj.findall(str_test) 


輸出:['//', '//'] 

這里要這么理解,首先第一重轉(zhuǎn)換是字符串自身的轉(zhuǎn)義,那么"////",實(shí)際上就是表示兩個反斜杠(兩個字符),然后傳入正則表達(dá)式解析器,因?yàn)榉葱备芤廊皇寝D(zhuǎn)義字符,那么進(jìn)行第二重轉(zhuǎn)換,兩個反斜杠就代表一個反斜杠,所以就能和一個反斜杠進(jìn)行匹配了,那么匹配連續(xù)的兩個反斜杠,寫正則表達(dá)式時就要寫8次"/"了,相當(dāng)壯觀,要匹配/d+(這個在正則表達(dá)式里面表示連續(xù)1一個以上的數(shù)字字符)這個字符串怎么寫呢? 
復(fù)制代碼代碼如下:

import re 
re_str_patt = "////d//+" 
print re_str_patt 
reObj = re.compile(re_str_patt) 
print reObj.findall("//d+") 
寫成re_str_patt = "////d/+"也行,因?yàn)?+對于字符串來說,沒有轉(zhuǎn)義意義,所以就當(dāng)成一個反斜杠了。 

在python中寫正則表達(dá)式時用得最多的是raw字符串,原生字符串,什么意思?就是只有一重轉(zhuǎn)換了,沒有字符串轉(zhuǎn)換了,只在正則表達(dá)式內(nèi)部進(jìn)行轉(zhuǎn)換了,這樣匹配一個反斜杠的正則表達(dá)式可以這樣寫,re_str_patt = r"//",有人會想,以后寫windows的文件路徑什么的方便了,呵呵直接 path = r"c:/myforder/xx" 搞定,是的,這句沒有問題,但是如果你寫成 path = r"c:/myforder/xx/",直接報錯了,為什么?因?yàn)榉葱备茈m然不作為轉(zhuǎn)義字符了,但是還是對它后面的引號(包括單引號)有影響,使這個引號不被視為字符串的終止,以為它后面還有字符,但是實(shí)際沒有,因此會報錯。其實(shí)可以反過來想raw字符串里面要表示引號怎么辦呢?,可以發(fā)現(xiàn) path = r"//123/"xxx" 是可以的,那用raw字符串豈不是有局限性?不過raw在設(shè)計之初就是用來支持正則表達(dá)式的,而在正則里面反斜杠是轉(zhuǎn)義字符,所以不可能出現(xiàn)在字符串的末尾的,所以建議不要圖方便在其他的地方使用raw。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 洪江市| 和静县| 汝州市| 奈曼旗| 五寨县| 灵山县| 黄大仙区| 新巴尔虎左旗| 额敏县| 鄂托克旗| 鄂伦春自治旗| 准格尔旗| 安宁市| 手游| 林芝县| 日喀则市| 灵宝市| 曲沃县| 澄迈县| 临安市| 大新县| 左云县| 海原县| 银川市| 平武县| 天峨县| 江源县| 龙里县| 象山县| 嘉禾县| 辽源市| 满洲里市| 电白县| 临沧市| 乐亭县| 保定市| 剑川县| 杨浦区| 重庆市| 鹤山市| 太白县|