国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

PHP中的遞歸正則表達式用法分享

2020-03-16 21:09:47
字體:
來源:轉載
供稿:網友
其實很多語言中的正則表達式都是支持遞歸的, 本文主要介紹PHP的正則遞歸. 雖然, 工作中最常用的正則表達式都很普通, 只用最基本的語法就能解決85%以上的問題, 而且合理有效地使用普通正則來解決復雜問題也是一門技巧與學問,但是更高級一點的語法的確有它存在的價值,看下面具體介紹
 
 
什么時候會用到遞歸正則表達式呢? 當然是待匹配的字串中遞歸地出現某種模式時(貌似廢話). 最經典的例子, 就是遞歸正則處理嵌套括號的問題了. 例子如下. 

假設你的文本中包含了正確配對的嵌套括號. 括號的深度可以是無限層. 你想捕獲這樣的括號組. 
復制代碼代碼如下:

<?php 
$string = "some text (a(b(c)d)e) more text"; 
if(preg_match("//(([^()]+|(?R))*/)/",$string,$matches)) { 
echo "<pre>"; print_r($matches); echo "</pre>"; 

?> 

結果是: 
復制代碼代碼如下:

Array 

[0] => (a(b(c)d)e) 
[1] => e 

可見, 我們所需要的文本, 已經捕獲到$matches[0]中了. 

原理 

現在思考原理. 

上面的正則表達式中的關鍵點是(?R). (?R)的作用就是遞歸地替換它所在的整條正則表達式. 在每次迭代時, PHP 語法分析器都會將(?R)替換為”/(([^()]+|(?R))*/)“. 
因此, 具體到上述的例子, 其正則表達式等價于: 
復制代碼代碼如下:

"//(([^()]+|/(([^()]+|/(([^()]+)*/))*/))*/)/" 

但是上面的代碼只適合深度為3層的括號. 對于未知深度的括號嵌套, 就只好使用這種正則了: 
復制代碼代碼如下:

"//(([^()]+|(?R))*/)/" 

它不但能夠匹配無限深度, 還簡化了正則表達式的語法. 功能強大, 語法簡潔. 

現在來細看一下"//(([^()]+|(?R))*/)/"是怎樣匹配"(a(b(c)d)e)"的: 

"(c)"這部分被正則式 "/(([^()]+)*/)" 匹配. 請注意, (c) 其實就相當于整個遞歸的一個縮影, 麻雀雖小五臟俱全, 因此它用到了整個正則表達式. 
換言之, 下一步中的(c), 可以使用(?R) 來匹配. 

(b(c)d)的匹配過程為: 
"/("匹配"("; 
"[^()]+"匹配"b"; 
(?R)匹配"(c)"; 
"[^()]+"匹配"d"; 
"/)"匹配")". 

根據上面的匹配原理, 不難理解為什么數組的第2個元素$matches[1]與'e'等價. 子串'e'是在最后一次匹配迭代中被捕獲. 匹配過程中, 只有最后一次的捕獲結果才會保存到數組中. 
關于這個特性, 可以自行嘗試一下, 看看使用正則式([a-z]+[0-9]+)+來匹配字串abc123xyz890, 其捕獲結果$1是什么. 注意, 其結果與 Left Longest 原理并不沖突. 

如果我們只需要捕獲 $matches[0], 可以這樣做: 
復制代碼代碼如下:

<?php 
$string = "some text (a(b(c)d)e) more text"; 
if(preg_match("/((?:[^()]+|(?R))*)/",$string,$matches)) 

echo "<pre>"; print_r($matches); echo "</pre>"; 

?> 
產生的結果相同: 

Array 

[0] => (a(b(c)d)e) 

所做的改動是捕獲括號()改為非捕獲捕獲括號(?:)了. 

還可以進一步完善為: 
復制代碼代碼如下:

<?php 
$string = "some text (a(b(c)d)e) more text"; 
if(preg_match("/((?>[^()]+|(?R))*)/",$string,$matches)) 

echo "<pre>"; print_r($matches); echo "</pre>"; 

?> 

這里我們用到了所謂的一次性模式(rex注: 余晟先生譯的《精通正則表達式v3.0》中, 謂之”固化分組”. 可參考該書.) PHP手冊也推薦只要條件允許, 就盡可能使用這種模式, 以便提升正則表達式的速度.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 兴仁县| 仙桃市| 惠水县| 西城区| 察雅县| 新津县| 台北县| 固原市| 苗栗县| 涞源县| 鹤壁市| 左贡县| 永昌县| 邯郸县| 青浦区| 兴化市| 怀化市| 达州市| 屯昌县| 忻城县| 沾化县| 滦平县| 宾川县| 聂荣县| 濮阳县| 青龙| 沁阳市| 香格里拉县| 汶上县| 云龙县| 喀什市| 顺平县| 廊坊市| 轮台县| 新平| 积石山| 儋州市| 昌江| 屯留县| 长岛县| 柞水县|