国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > .NET > 正文

.NET正則表達式使用高級技巧之反向引用

2024-07-10 13:11:28
字體:
來源:轉載
供稿:網友
  • 本文來源于網頁設計愛好者web開發社區http://www.html.org.cn收集整理,歡迎訪問。
  •   反向引用,指把匹配出來的組引用到表達式本身其它地方,比如,在匹配html的標記時,我們匹配出一個<a>,我們要把匹配出來的a引用出來,用來找到</a>,這個時候就要用到反向引用。

      語法

      a、反向引用編號的組,語法為/number

      b、反向引用命名的組,語法為/k<name>

      舉例

      a、匹配成對的html標簽

    @"<(?<tag>[^/s>]+)[^>]*>.*<//k<tag>>"

      b、匹配兩個兩個重疊出現的字符

    public static void main()
    {
    string s = "aabbc11asd";
    regex reg = new regex(@"(/w)/1");
    matchcollection matches = reg.matches(s);
    foreach(match m in matches)
    console.writeline(m.value);
    console.readline();
    }

      返回結果為aa bb 11

      輔助匹配組

      以下幾種組結構,括號中的pattern都不作為匹配結果的一部分進行保存

      1、正聲明(?=)

      涵義:括號中的模式必須出現在聲明右側,但不作為匹配的一部分

    public static void main()
    {
    string s = "c#.net,vb.net,php,java,jscript.net";
    regex reg = new regex(@"[/w/#]+(?=/.net)",regexoptions.compiled);
    matchcollection mc = reg.matches(s);
    foreach(match m in mc)
    console.writeline(m.value);
    console.readline();
    //輸出 c# vb jscript
    }

      可以看到匹配引擎要求匹配.net,但卻不把.net放到匹配結果中

      2、負聲明(?!)

      涵義:括號中的模式必須不出現在聲明右側

      下例演示如何取得一個<a>標簽對中的全部內容,即使其中包含別的html tag。

    public static void main()
    {
    string newscontent = @"url:<a href=""1.html""><img src=""http://m.survivalescaperooms.com/htmldata/2006-03-23/http://m.survivalescaperooms.com/htmldata/2006-03-23/1.gif"">test<span color:red;"">regex</span></a>.";
    regex regend = new regex(@"</s*a[^>]*>([^<]|<(?!/a))*</s*/a/s*>",regexoptions.multiline);

    console.writeline(regend.match(newscontent).value);
    //result: <a href="1.html"><img src="http://m.survivalescaperooms.com/htmldata/2006-03-23/http://m.survivalescaperooms.com/htmldata/2006-03-23/1.gif">test<span >regex</span></a>
    console.readline();
    }

      3、反向正聲明(?<=)

      涵義:括號中的模式必須出現在聲明左側,但不作為匹配的一部分

      4、反向負聲明(?<!)

      涵義:括號中的模式必須不出現在聲明左側

      非回溯匹配

      語法:(?>)

      涵義:該組匹配后,其匹配的字符不能通過回溯用于后面的表達式的匹配。呵呵,光看這句話肯定搞不懂,我當初為了搞懂這個也花了不少的時間,還是通過實例來說明吧:
    "www.csdn.net" 可以通過@"/w+/.(.*)/./w+"來匹配,卻不能通過@"/w+/.(?>.*)/./w+"來匹配!為什么呢?

      原因是正則匹配是貪婪的,匹配時它會盡可能多的匹配最多的結果,所以,上例兩個正則式中的.*都會把csdn.net匹配完, 這個時候,第一個表達式在開始匹配時發現/./w+沒得字符給它匹配了,所以它會進行回溯,所謂回溯,就是把.*匹配的結果往回推,回推留出來的字符再用來匹配/./w+,直到/./w+匹配成功,整個表達式返回成功的匹配結果。而第二個表達式,因使用的是非回溯匹配,所以,.*匹配完后,不允許通過回溯來匹配/./w+,所以整個表達式匹配失敗。

      請注意,回溯匹配是很浪費資源的一種匹配方式,所以,請盡量避免您的正則式要通過回溯來成功匹配,如上例,可以換成@"/w+/.([^/.]+/.)+/w+"+"。
    發表評論 共有條評論
    用戶名: 密碼:
    驗證碼: 匿名發表
    主站蜘蛛池模板: 波密县| 全南县| 和平区| 理塘县| 龙泉市| 淮南市| 崇州市| 西林县| 景德镇市| 通道| 岳西县| 五大连池市| 时尚| 毕节市| 民丰县| 祁阳县| 长汀县| 山阳县| 海阳市| 彰化县| 松原市| 江孜县| 陵川县| 嘉鱼县| 安多县| 九龙城区| 大方县| 来凤县| 二连浩特市| 昔阳县| 呼和浩特市| 盈江县| 怀化市| 正定县| 武功县| 庐江县| 垫江县| 那曲县| 乐至县| 东方市| 阳春市|