国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學(xué)院 > 開發(fā)設(shè)計 > 正文

數(shù)據(jù)采集類

2019-11-14 16:33:39
字體:
供稿:網(wǎng)友

爬蟲,又稱蜘蛛,是從別的網(wǎng)站抓取資源的一種方法,C#.NET使用爬蟲的方法如下:

PRotected string GetPageHtml(string url){string pageinfo;try{WebRequest myreq = WebRequest.Create(url);WebResponse myrep = myreq.GetResponse();StreamReader reader = new StreamReader(myrep.GetResponseStream(), Encoding.GetEncoding("gb2312"));pageinfo = reader.ReadToEnd();}catch{pageinfo = "";}return pageinfo;}

 

 


按上述方法就可以在程序中獲取某URL的頁面源文件。
但是有些網(wǎng)站屏蔽了爬蟲,那就需要模擬瀏覽器獲取的方法來進行,具體代碼如下:

protected string GetPageHtml(string url){string pageinfo;try{HttpWebRequest myReq = (HttpWebRequest)HttpWebRequest.Create(url);myReq.Accept = "image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/x-shockwave-Flash, application/vnd.ms-Excel, application/vnd.ms-Powerpoint, application/msWord, */*";myReq.UserAgent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727)";HttpWebResponse myRep = (HttpWebResponse)myReq.GetResponse();Stream myStream = myRep.GetResponseStream();StreamReader sr = new StreamReader(myStream, Encoding.Default);pageinfo = sr.ReadToEnd().ToString();}catch{pageinfo = "";}return pageinfo;}

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 咸阳市| 桃园市| 怀远县| 忻城县| 吐鲁番市| 白水县| 邛崃市| 祁连县| 尼木县| 常山县| 南岸区| 朝阳区| 德州市| 菏泽市| 玛纳斯县| 泗阳县| 临湘市| 贡嘎县| 衡阳县| 汕尾市| 枞阳县| 乌拉特中旗| 嘉善县| 厦门市| 遂宁市| 皋兰县| 齐齐哈尔市| 武川县| 荥经县| 青浦区| 长乐市| 西峡县| 元谋县| 界首市| 鹤岗市| 固原市| 云梦县| 沧源| 西平县| 衡阳市| 英山县|