国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python處理中文編碼和判斷編碼示例

2020-02-23 05:12:46
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

下面所說(shuō)的都是針對(duì)python2.7

代碼如下:
#coding:utf-8
#chardet 需要下載安裝

import chardet
#抓取網(wǎng)頁(yè)html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

  html = html_1
else :
   html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上處理,整個(gè)html就不會(huì)是亂碼。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 武定县| 高雄县| 汉沽区| 三门峡市| 章丘市| 喀喇沁旗| 南康市| 进贤县| 婺源县| 闽侯县| 浮山县| 日土县| 襄樊市| 玉溪市| 四平市| 红河县| 方正县| 修武县| 民勤县| 北票市| 容城县| 囊谦县| 黄陵县| 安塞县| 鲁山县| 沙河市| 南川市| 宣威市| 高密市| 建平县| 浑源县| 长沙市| 大方县| 宜阳县| 博白县| 山西省| 手游| 义马市| 西丰县| 岳普湖县| 新竹县|