国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > C# > 正文

C#基于正則表達式抓取a標簽鏈接和innerhtml的方法

2019-10-29 21:10:05
字體:
來源:轉載
供稿:網友

本文實例講述了C#基于正則表達式抓取a標簽鏈接和innerhtml的方法。分享給大家供大家參考,具體如下:

//讀取網頁htmlstring text = File.ReadAllText(Environment.CurrentDirectory + "//test.txt", Encoding.GetEncoding("gb2312"));string prttern = "<a(//s+(href=/"(?<url>([^/"])*)/"|'([^'])*'|//w+=/"(([^/"])*)/"|'([^'])*'))+>(?<text>(.*?))</a>";var maths = Regex.Matches(text, prttern);//抓取出來寫入的文件using (FileStream w = new FileStream(Environment.CurrentDirectory + "//wirter.txt", FileMode.Create)){    for (int i = 0; i < maths.Count; i++)    {      byte[] bs = Encoding.UTF8.GetBytes(string.Format("鏈接地址:{0},  innerhtml:{1}", maths[i].Groups["url"].Value,        maths[i].Groups["text"].Value) + "/r/n");      w.Write(bs, 0, bs.Length);      Console.WriteLine();    }}Console.ReadKey();

圖解正則

C#,正則表達式,抓取,a標簽,鏈接,innerhtml

朋友需要截取img標簽的src 和data-url   跟上面差不多。。順便附上

string text =File.ReadAllText(Environment.CurrentDirectory + "//test.txt", Encoding.GetEncoding("gb2312"));string prttern = "<img(//s*(src=/"(?<src>[^/"]*?)/"|data-url=/"(?<dataurl>[^/"]*?)/"|[-//w]+=/"[^/"]*?/"))*//s*/>";var maths = Regex.Matches(text, prttern);//抓取出來寫入的文件using (FileStream w = new FileStream(Environment.CurrentDirectory + "//wirter.txt", FileMode.Create)){    for (int i = 0; i < maths.Count; i++)    {      byte[] bs = Encoding.UTF8.GetBytes(string.Format("圖片src:{0},  圖片data-url:{1}", maths[i].Groups["src"].Value,        maths[i].Groups["dataurl"].Value) + "/r/n");      w.Write(bs, 0, bs.Length);      Console.WriteLine();    }}

希望本文所述對大家C#程序設計有所幫助。


注:相關教程知識閱讀請移步到c#教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 伊宁县| 泸州市| 噶尔县| 云安县| 河池市| 德令哈市| 白朗县| 临江市| 庄浪县| 河源市| 青海省| 桃源县| 石阡县| 平昌县| 和静县| 玉树县| 岑巩县| 克山县| 如皋市| 清流县| 平舆县| 凤阳县| 同心县| 南宫市| 大悟县| 囊谦县| 杨浦区| 安庆市| 达州市| 隆林| 乌拉特中旗| 资阳市| 上林县| 山东省| 汉川市| 朝阳县| 阳东县| 新兴县| 定安县| 榆林市| 乌拉特中旗|