国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > .NET > 正文

asp.net 網頁編碼自動識別代碼

2024-07-10 13:21:57
字體:
來源:轉載
供稿:網友

復制代碼 代碼如下:


using System;
using System.Net;
using System.Text;
using System.Text.RegularExpressions;

class Program
{
// 獲取網頁的HTML內容,根據網頁的charset自動判斷Encoding
static string GetHtml(string url)
{
return GetHtml(url, null);
}

// 獲取網頁的HTML內容,指定Encoding
static string GetHtml(string url, Encoding encoding)
{
byte[] buf = new WebClient().DownloadData(url);
if (encoding != null) return encoding.GetString(buf);
string html = Encoding.UTF8.GetString(buf);
encoding = GetEncoding(html);
if (encoding == null || encoding == Encoding.UTF8) return html;
return encoding.GetString(buf);
}

// 根據網頁的HTML內容提取網頁的Encoding
static Encoding GetEncoding(string html)
{
string pattern = @"(?i)/bcharset=(?<charset>[-a-zA-Z_0-9]+)";
string charset = Regex.Match(html, pattern).Groups["charset"].Value;
try { return Encoding.GetEncoding(charset); }
catch (ArgumentException) { return null; }
}

// 程序入口
static void Main()
{
Console.WriteLine(GetHtml());

Console.Read();
}
}

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 浙江省| 襄汾县| 马龙县| 鄂州市| 萨迦县| 南平市| 维西| 丰县| 会昌县| 金寨县| 威海市| 沁源县| 永福县| 云南省| 邵阳市| 罗源县| 台东县| 新密市| 天津市| 朝阳县| 阳信县| 罗甸县| 武城县| 西丰县| 襄樊市| 京山县| 平武县| 呈贡县| 江津市| 罗定市| 日土县| 浦北县| 巴楚县| 泸定县| 利川市| 讷河市| 巴中市| 藁城市| 鄄城县| 泸州市| 祁连县|