有時候不知道要匹配多少字符。為了能適應這種不確定性,正則表達式支持限定符的概念。這些限定符可以指定正則表達式的一個給定組件必須要出現(xiàn)多少次才能滿足匹配。
下表給出了各種限定符及其含義的說明:
| 字符 | 描述 |
|---|---|
| * | 匹配前面的子表達式零次或多次。例如,zo* 能匹配 "z" 以及 "zoo"。 * 等價于{0,}。 |
| + | 匹配前面的子表達式一次或多次。例如,'zo+' 能匹配 "zo" 以及 "zoo",但不能匹配 "z"。+ 等價于 {1,}。 |
| ? | 匹配前面的子表達式零次或一次。例如,"do(es)?" 可以匹配 "do" 或 "does" 中的"do" 。? 等價于 {0,1}。 |
| {n} | n 是一個非負整數(shù)。匹配確定的 n 次。例如,'o{2}' 不能匹配 "Bob" 中的 'o',但是能匹配 "food" 中的兩個 o。 |
| {n,} | n 是一個非負整數(shù)。至少匹配n 次。例如,'o{2,}' 不能匹配 "Bob" 中的 'o',但能匹配 "foooood" 中的所有 o。'o{1,}' 等價于 'o+'。'o{0,}' 則等價于 'o*'。 |
| {n,m} | m 和 n 均為非負整數(shù),其中n <= m。最少匹配 n 次且最多匹配 m 次。劉, "o{1,3}" 將匹配 "fooooood" 中的前三個 o。'o{0,1}' 等價于 'o?'。請注意在逗號和兩個數(shù)之間不能有空格。 |
對一個很大的輸入文檔而言,章節(jié)數(shù)很輕易就超過九章,因此需要有一種方法來處理兩位數(shù)或者三位數(shù)的章節(jié)號。限定符就提供了這個功能。下面的Visual Basic Scripting Edition 正則表達式可以匹配具有任何位數(shù)的章節(jié)標題:
/Chapter [1-9][0-9]*/下面的 VBScript 正則表達式執(zhí)行同樣的匹配:
"Chapter [1-9][0-9]*"請注意限定符出現(xiàn)在范圍表達式之后。因此,它將應用于所包含的整個范圍表達式,在本例中,只指定了從 0 到 9 的數(shù)字。
這里沒有使用 '+' 限定符,因為第二位或后續(xù)位置上并不一定需要一個數(shù)字。同樣也沒有使用 '?' 字符,因為這將把章節(jié)數(shù)限制為只有兩位數(shù)字。在 'Chapter' 和空格字符之后至少要匹配一個數(shù)字。
如果已知章節(jié)數(shù)限制只有99 章,則可以使用下面的 Visual Basic Scripting Edition 表達式來指定至少有一位數(shù)字,但不超過兩個數(shù)字。
/Chapter [0-9]{1,2}/對 VBScript 可以使用下述正則表達式:
"Chapter [0-9]{1,2}"上述表達式的缺點是如果有一個章節(jié)號大于 99,它仍只會匹配前兩位數(shù)字。另一個缺點是某些人可以創(chuàng)建一個 Chapter 0,而且仍能匹配。一個更好的用來匹配兩位數(shù)的 Visual Basic Scripting Edition 表達式如下:
/Chapter [1-9][0-9]?/或者
/Chapter [1-9][0-9]{0,1}/對 VBScript 而言,下述表達式與上面等價:
"Chapter [1-9][0-9]?"或者
"Chapter [1-9][0-9]{0,1}"'*'、 '+'和 '?' 限定符都稱之為貪婪的,也就是說,他們盡可能多地匹配文字。有時這根本就不是所希望發(fā)生的情況。有時則正好希望最小匹配。
例如,你可能要搜索一個 HTML 文檔來查找一處包含在 H1 標記中的章節(jié)標題。在文檔中該文字可能具有如下形式:
<H1>Chapter 1
主站蜘蛛池模板:
菏泽市|
贵阳市|
恩施市|
游戏|
滨州市|
房山区|
承德市|
如皋市|
探索|
什邡市|
多伦县|
庐江县|
买车|
英德市|
武鸣县|
红桥区|
河东区|
桦川县|
济源市|
罗平县|
黄冈市|
定州市|
武定县|
定边县|
巴林右旗|
苍山县|
广元市|
田阳县|
全南县|
阿荣旗|
阿勒泰市|
井陉县|
盐山县|
米易县|
五家渠市|
杂多县|
金湖县|
林甸县|
安乡县|
江安县|
江孜县|