国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > C# > 正文

c#使用nsoup解析html亂碼解決方法分享 nsoup教程

2020-01-24 02:54:35
字體:
來源:轉載
供稿:網友

下載地址:http://nsoup.codeplex.com/

簡單用法如下:

復制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

處理網絡上的頁面:

復制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://m.survivalescaperooms.com/").Get();

但是遺憾的是NSoup默認的編碼是UTF-8,處理中文有亂碼(對于編碼是UTF-8的自然不會有亂碼,但是有些GB2312的就可能有亂碼,謝謝 forhells的提醒)。

目前我找到兩種解決辦法:

1.下載網頁源代碼再處理

復制代碼 代碼如下:

WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://m.survivalescaperooms.com"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

2.獲得網頁的流

復制代碼 代碼如下:

WebRequest webRequest=WebRequest.Create("http://m.survivalescaperooms.com");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");

第二種用著比較方便,但是我覺得第一種比較合適,畢竟NSoup是個Html解析類,下載網頁代碼這種事情本來不應該交給它。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 庆云县| 石柱| 阿坝县| 浮梁县| 东光县| 六枝特区| 镇平县| 都昌县| 吉水县| 金山区| 浮山县| 高唐县| 西充县| 中山市| 普定县| 公主岭市| 武强县| 镇赉县| 绥阳县| 曲阜市| 克拉玛依市| 平遥县| 吉隆县| 镇巴县| 普安县| 永昌县| 弥勒县| 定日县| 大英县| 乾安县| 海林市| 舞阳县| 涿州市| 务川| 剑阁县| 旌德县| 石首市| 犍为县| 惠水县| 鲜城| 仁化县|