下載地址:http://nsoup.codeplex.com/
簡單用法如下:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
處理網絡上的頁面:
NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://m.survivalescaperooms.com/").Get();
但是遺憾的是NSoup默認的編碼是UTF-8,處理中文有亂碼(對于編碼是UTF-8的自然不會有亂碼,但是有些GB2312的就可能有亂碼,謝謝 forhells的提醒)。
目前我找到兩種解決辦法:
1.下載網頁源代碼再處理
WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://m.survivalescaperooms.com"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);
2.獲得網頁的流
WebRequest webRequest=WebRequest.Create("http://m.survivalescaperooms.com");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");
第二種用著比較方便,但是我覺得第一種比較合適,畢竟NSoup是個Html解析類,下載網頁代碼這種事情本來不應該交給它。