国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

正則表達式 運算符優先級介紹

2020-03-16 20:59:07
字體:
來源:轉載
供稿:網友
正則表達式從左到右進行計算,并遵循優先級順序,這與算術表達式非常類似
 

正則表達式從左到右進行計算,并遵循優先級順序,這與算術表達式非常類似。

相同優先級的從左到右進行運算,不同優先級的運算先高后低。下表從最高到最低說明了各種正則表達式運算符的優先級順序:

運算符 描述
/ 轉義符
(), (?:), (?=), [] 圓括號和方括號
*, +, ?, {n}, {n,}, {n,m} 限定符
^, $, /任何元字符、任何字符 定位點和序列(即:位置和順序)
| 替換,"或"操作
字符具有高于替換運算符的優先級,使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food",請使用括號創建子表達式,從而產生"(m|f)ood"。

今天的表是對整體的正則表達式語法中的元字符的分類匯總。幫助記憶各元字符。同上一樣,該文檔轉載至MSDN。

 

運算符

 

下表從最高到最低說明了各種正則表達式運算符的優先級順序:

 

運算符

說明

/

轉義符

(), (?:), (?=), []

括號和中括號

*, +, ?, {n}, {n,}, {n,m}

限定符

^, $, /任何元字符、任何字符

定位點和序列

|

替換

 

字符具有高于替換運算符的優先級,使得“m|food”匹配“m”或“food”。若要匹配“mood”或“food”,請使用括號創建子表達式,從而產生“(m|f)ood”。

 

特殊字符表

 

 

特殊字符

注釋

$

匹配輸入字符串結尾的位置。如果設置了 RegExp 對象的 Multiline 屬性,那么 $ 還匹配 /n 或 /r 前面的位置。若要匹配 $ 字符本身,請使用 /$。

( )

標記子表達式的開始和結束。可以捕獲子表達式以供以后使用。若要匹配這兩個字符,請使用 /( 和 /)。

*

零次或多次匹配前面的字符或子表達式。若要匹配 * 字符,請使用 /*。

+

一次或多次匹配前面的字符或子表達式。若要匹配 + 字符,請使用 /+。

.

匹配除換行符 /n 之外的任何單個字符。若要匹配 .,請使用 /。

[ ]

標記中括號表達式的開始。若要匹配這些字符,請使用 /[ 和 /]。

?

零次或一次匹配前面的字符或子表達式,或指示“非貪心”限定符。若要匹配 ? 字符,請使用 /?。

/

將下一字符標記為特殊字符、文本、反向引用或八進制轉義符。例如,字符 n 匹配字符 n。/n 匹配換行符。序列 // 匹配 /,序列 /( 匹配 (。

/

表示文本正則表達式的開始或結束。若要匹配 / 字符,請使用 //。

^

匹配輸入字符串開始處的位置,但在中括號表達式中使用的情況除外,在那種情況下它對字符集求反。若要匹配 ^ 字符本身,請使用 /^。

{ }

標記限定符表達式的開始。若要匹配這些字符,請使用 /{ 和 /}。

|

指出在兩個項之間進行選擇。要匹配 |,請使用 /|。

 

 

限定符含義

 

 

字符

說明

*

零次或多次匹配前面的字符或子表達式。例如,zo* 匹配 z 和 zoo。* 等效于 {0,}。

+

一次或多次匹配前面的字符或子表達式。例如,zo+ 匹配 zo 和 zoo,但不匹配 z。+ 等效于 {1,}。

?

零次或一次匹配前面的字符或子表達式。例如,do(es)? 匹配 do 或 does 中的 do。? 等效于 {0,1}。

{n}

n 是非負整數。正好匹配 n 次。例如,o{2} 不匹配 Bob 中的 o,但匹配 food 中的兩個 o。

{n,}

n 是非負整數。至少匹配 n 次。例如,o{2,} 不匹配 Bob 中的 o,而匹配 foooood 中的所有 o。o{1,} 等效于 o+。o{0,} 等效于 o*。

{n,m}

m 和 n 是非負整數,其中 n <= m。匹配至少 n 次,至多 m 次。例如,o{1,3} 匹配 fooooood 中的頭三個 o。o{0,1} 等效于 o?。注意:您不能將空格插入逗號和數字之間。

 

由于章節編號在大的輸入文檔中會很可能超過九,所以您需要一種方式來處理兩位或三位章節編號。限定符給您這種能力。下面的正則表達式匹配編號為任何位數的章節標題:

 

/Chapter [1-9][0-9]*/

 

請注意,限定符出現在范圍表達式之后。因此,它應用于整個范圍表達式,在本例中,只指定從 0 到 9 的數字(包括 0 和 9)。

這里不使用 + 限定符,因為在第二個位置或后面的位置不一定需要有一個數字。也不使用?字符,因為它將章節編號限制到只有兩位數。您需要至少匹配 Chapter 和空格字符后面的一個數字。

如果您知道章節編號被限制為只有 99 章,可以使用下面的表達式來至少指定一位但至多兩位數字。

 

/Chapter [0-9]{1,2}/

 

上面的表達式的缺點是,大于 99 的章節編號仍只匹配開頭兩位數字。另一個缺點是 Chapter 0 也將匹配。只匹配兩位數字的更好的表達式如下:

 

/Chapter [1-9][0-9]?/

 

 

/Chapter [1-9][0-9]{0,1}/

 

*、+ 和 ? 限定符都被稱為“貪心的”,因為它們匹配盡可能多的文本。但是,有時您只需要最小的匹配。

例如,您可能搜索 HTML 文檔,以查找括在 H1 標記內的章節標題。該文本在您的文檔中如下:

 

<H1>Chapter 1 – Introduction to Regular Expressions</H1>

 

下面的表達式匹配從開始小于符號 (<) 到關閉 H1 標記的大于符號 (>) 之間的所有內容。

 

/<.*>/

 

如果您只需要匹配開始 H1 標記,下面的“非貪心”表達式只匹配 <H1>。

 

/<.*?>/

 

通過在 *、+ 或 ? 限定符之后放置 ?,該表達式從“貪心”表達式轉換為“非貪心”表達式或者最小匹配。



注:相關教程知識閱讀請移步到正則表達式頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 高雄市| 宁强县| 雅安市| 中阳县| 宁强县| 高碑店市| 隆化县| 阿克陶县| 如皋市| 江北区| 灯塔市| 乐平市| 元江| 仁布县| 大方县| 剑河县| 通化县| 定陶县| 榕江县| 翼城县| 渭南市| 富锦市| 乌鲁木齐县| 沙河市| 凤凰县| 明溪县| 济宁市| 资溪县| 盐津县| 北辰区| 汶上县| 巩留县| 满洲里市| 邵阳市| 雷州市| 偃师市| 四子王旗| 墨竹工卡县| 古交市| 龙南县| 西贡区|