国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

網站數據獲取

2019-11-17 02:49:41
字體:
來源:轉載
供稿:網友

網站數據獲取

本例中主要是通過HtmlAgilityPack解析html源碼獲取所需的數據.

using HtmlAgilityPack;

1.通過C#中WebRequest,WebResponse,StreamReader類獲取網頁源代碼

WebRequest request = WebRequest.Create(url);using (WebResponse response = request.GetResponse())using (StreamReader reader = new StreamReader(response.GetResponseStream(), encoding))result = reader.ReadToEnd();

2.通過網頁URL獲取HtmlNode ,通過HtmlAgilityPack中的HtmlDocument類獲取

HtmlAgilityPack.HtmlDocument document = new HtmlAgilityPack.HtmlDocument();document.LoaDHTML(htmlSource);HtmlNode rootNode = document.DocumentNode;return rootNode;

3.通過HtmlNode的SelectSingleNode方法就可獲取你所需要的內容了,注意以下代碼中path是HTML的標簽路徑如:path="http://div[@class='article_title']/h1/span/a";//文章標題PATH

對應于

<div class=’article_title’>

<h1>

<span>

<a>獲取這里的內容

</a>

</span>

</h1>

</div>

參考源碼如下:

HtmlNode temp = srcNode.SelectSingleNode(path);if (temp == null)return null;return temp.InnerText;

返回值為: 獲取這里的內容

其中temp.InnerHtml可獲取網站HTML的內容如:<a>獲取這里的內容</a>

通過以上操作就可獲取到網站中你所需要的內容,希望此內容對大家有所幫助,引用源碼文章鏈接http://blog.csdn.net/gdjlc/article/details/11620915


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 肇州县| 五大连池市| 屏东市| 板桥市| 南投市| 醴陵市| 札达县| 富民县| 白玉县| 新建县| 筠连县| 东乡族自治县| 吉木乃县| 鄂尔多斯市| 大安市| 铜鼓县| 宝兴县| 抚顺市| 乌兰县| 攀枝花市| 海丰县| 太湖县| 昌吉市| 马山县| 塔城市| 尤溪县| 济阳县| 海口市| 莫力| 沛县| 连云港市| 乐陵市| 明水县| 定襄县| 河西区| 府谷县| 巢湖市| 襄樊市| 黄平县| 马公市| 丰原市|