国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

ASP.NET網(wǎng)頁抓取數(shù)據(jù)

2019-11-17 02:12:22
字體:
供稿:網(wǎng)友

asp.net網(wǎng)頁抓取數(shù)據(jù)

我的數(shù)據(jù)通過一個(gè)TextBox輸入,這些代碼是寫在一個(gè)button的點(diǎn)擊事件里的。

網(wǎng)頁數(shù)據(jù)抓取大概分為兩步,第一步是獲取網(wǎng)頁源代碼:

具體注釋如下:

var currentUrl = TextBox1.Text;//獲得要抓取的網(wǎng)頁的URL地址 var request = WebRequest.Create(currentUrl) as HttpWebRequest;//請(qǐng)求對(duì)象 var response=request.GetResponse()as HttpWebResponse;//定義頁面回應(yīng)對(duì)象

var encode = string.Empty; encode = response.CharacterSet;//獲得網(wǎng)頁的編碼

Stream stream;//數(shù)據(jù)流 if (response.ContentEncoding.ToLower() == "gzPRessionMode.Decompress); } else { stream = response.GetResponseStream(); }//解壓縮 var sr = new StreamReader(stream,Encoding.GetEncoding(encode));//定義數(shù)據(jù)流讀取對(duì)象 var html = sr.ReadToEnd(); sr.Close(); HtmlDocument document=new HtmlDocument(); document.LoaDHTML(html);//將數(shù)據(jù)存入document

得到了網(wǎng)頁源代碼,接下來就是對(duì)其解析,就是第二步:

解析可以使用正則表達(dá)式或是Spilt等字符串操作方法。

根據(jù)源代碼寫出的Xpath,利用節(jié)點(diǎn)得到位于兩個(gè)節(jié)點(diǎn)之間的數(shù)據(jù):

我的對(duì)象網(wǎng)頁就是我的博客主頁http://home.VEVb.com/u/xuwanghu/

string sumLine = document.DocumentNode.SelectSingleNode("http://body//ul[@id='user_profile']").InnerText;

string yuanlin = sumLine2.ToString().Split(':')[0].Split('博')[0];

這樣子,就將園齡存入了yuanlin,也就實(shí)現(xiàn)了抓取網(wǎng)頁數(shù)據(jù)的功能。


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 张家界市| 汉沽区| 苗栗市| 壶关县| 中卫市| 乌审旗| 东城区| 洛宁县| 肥城市| 伊金霍洛旗| 仁怀市| 江北区| 沁源县| 安新县| 高邑县| 南和县| 吴江市| 深泽县| 靖远县| 鲁甸县| 航空| 县级市| 大洼县| 玛纳斯县| 汤原县| 读书| 常熟市| 灌云县| 临江市| 合川市| 房山区| 霍邱县| 南汇区| 梁平县| 肇州县| 都匀市| 乐安县| 甘德县| 泗水县| 永川市| 重庆市|