国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

python處理中文編碼和判斷編碼示例

2019-11-25 18:30:17
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

下面所說(shuō)的都是針對(duì)python2.7

復(fù)制代碼 代碼如下:

#coding:utf-8
#chardet 需要下載安裝

import chardet
#抓取網(wǎng)頁(yè)html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':

  html = html_1
else :
   html = html_1.decode('gbk','ignore').encode('utf-8')

#有以上處理,整個(gè)html就不會(huì)是亂碼。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 顺昌县| 盖州市| 杂多县| 安仁县| 沈阳市| 翁牛特旗| 临泽县| 张掖市| 盘锦市| 东辽县| 玉龙| 嫩江县| 象州县| 屯昌县| 和静县| 巩留县| 隆安县| 安阳市| 沛县| 台北县| 蓬安县| 建阳市| 通渭县| 红河县| 慈溪市| 汶上县| 海口市| 昂仁县| 隆子县| 安宁市| 英吉沙县| 五家渠市| 昌吉市| 江永县| 灵石县| 永川市| 万全县| 鱼台县| 颍上县| 高青县| 茂名市|