国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

Python正則表達(dá)式教程之二:捕獲篇

2019-11-25 16:20:23
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

前言

上一篇文中,我們介紹了關(guān)于Python正則表達(dá)式的基礎(chǔ),那么在這一篇文章里,我們將總結(jié)一下正則表達(dá)式關(guān)于捕獲的用法。下面話不多說(shuō),來(lái)看看詳細(xì)的介紹吧。   

捕獲

捕獲和分組在正則表達(dá)式中有著密切的聯(lián)系,一般情況下,分組即捕獲,都用小括號(hào)完成(因此,小括號(hào)在正則表達(dá)式中也屬于特殊字符,表達(dá)原含義時(shí)需要轉(zhuǎn)義): 

      (…)     正常分組,并捕獲

      (?:…)   分組,但是不捕獲 

舉個(gè)例子,假設(shè)我們需要匹配一個(gè)座機(jī)號(hào)碼:

>>> m = re.search(r'^(/d{3,4}-)?(/d{7,8})$','020-82228888')>>> m.group(0)'020-82228888'>>> m.group(1)'020-'>>> m.group(2)'82228888'

這里,默認(rèn)分組(0)是完整的匹配,之后的分組則按出現(xiàn)順序排列。 

接下來(lái),我們想在一整段文本中,找出所有的座機(jī)號(hào)碼,這里需要用到re.findall:

>>> re.findall(r'(/d{3,4}-)?(/d{7,8})','020-82228888/n0357-4227865') [('020-', '82228888'), ('0357-', '4227865')]

findall有一個(gè)特性,就是如果結(jié)果中有捕獲的分組,則將捕獲的分組組成tuple返回。利用這個(gè)特點(diǎn),和上面提到的分組,但是不捕獲的語(yǔ)法,可以得到我們想要的結(jié)果:

>>> re.findall(r'(?:/d{3,4}-)?/d{7,8}','020-82228888/n0357-4227865') ['020-82228888', '0357-4227865']>>> re.findall(r'(?:/d{3,4}-)?/d{7,8}','020-82228888/n4227865')  ['020-82228888', '4227865']

在正則表達(dá)式中,也可以通過(guò)/1,/2等來(lái)指代之前捕獲的字符串組合。這個(gè)經(jīng)常用于單雙引號(hào)的正確匹配:

>>> sentence = """You said "why?" and I say "I don't know".""">>> re.findall(r'["/'](.*?)["/']', sentence)['why?', 'I don']>>> re.findall(r'(["/'])(.*?)/1', sentence)[('"', 'why?'), ('"', "I don't know")]

此外,如果覺得/1,/2這種表示可讀性不好的話,還可以給捕獲起一個(gè)英文名字。如下例子中,實(shí)現(xiàn)了兩種不同的日期格式之間的轉(zhuǎn)換:

>>> sentence = "from 12/22/1629 to 11/14/1643">>> re.sub(r'(?P<month>/d{2})/(?P<day>/d{2})/(?P<year>/d{4})', r'/g<year>-/g<month>-/g<day>', sentence) 'from 1629-12-22 to 1643-11-14'

但是,這種命名引用捕獲的方式,在findall、search中卻是無(wú)效的:

>>> sentence = """You said "why?" and I say "I don't know".""">>> re.findall(r'(?P<quote>["/'])(.*?)/g<quote>', sentence)  []>>> re.search(r'(?P<quote>["/'])(.*?)/g<quote>', sentence)   >>> re.search(r'(?P<quote>["/'])(.*?)/1', sentence)  <_sre.SRE_Match object; span=(9, 15), match='"why?"'>>>> re.search(r'(?P<quote>["/'])(.*?)/1', sentence).groupdict(){'quote': '"'}

總結(jié)

以上就是Python正則表達(dá)式中關(guān)于分組捕獲的全部?jī)?nèi)容了,希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者使用python能能帶來(lái)一定的幫助,如果有疑問(wèn)大家可以留言交流,如果有疑問(wèn)大家可以留言交流。下一篇文章,我會(huì)繼續(xù)總結(jié)一下正則表達(dá)式匹配時(shí)的貪婪/非貪婪特性。 請(qǐng)繼續(xù)關(guān)注武林網(wǎng)。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 津南区| 鹿泉市| 芒康县| 郸城县| 石城县| 鄄城县| 锡林郭勒盟| 上犹县| 新邵县| 勐海县| 金阳县| 永川市| 宜章县| 包头市| 酒泉市| 兴和县| 舒兰市| 海淀区| 贵定县| 延吉市| 乌鲁木齐县| 阿克陶县| 黄冈市| 油尖旺区| 苏尼特右旗| 太白县| 阳高县| 石狮市| 隆回县| 威海市| 琼结县| 博兴县| 黄梅县| 宁海县| 卢湾区| 琼中| 南昌市| 罗城| 文成县| 云南省| 柯坪县|