国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<td id="1vtrr"></td>

<td id="1vtrr"><tr id="1vtrr"><th id="1vtrr"></th></tr></td>

首頁 > 編程 > Python > 正文

記錄使用python時遇到的中文編碼問題與解決方法

2019-11-06 07:54:56

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

記錄使用python時遇到的中文編碼問題與解決方法

剛接觸python時，師兄就教導(dǎo)我們在每個py文件的第一行要加上# coding=utf-8這句話啦

在一開始的處理時并沒有遇到問題，可隨著處理的東西越來越多，各種各樣的問題就出現(xiàn)了，為了盡量避免這些問題首先是把Pycharm的編碼統(tǒng)一了，如圖

如果是處理獲取到的網(wǎng)頁源代碼，不要偷懶，先看看源代碼的編碼，就像下圖中的charset=一般來說就是它的編碼了如果網(wǎng)頁源代碼的編碼和自己編譯器的不同，會出現(xiàn)中文亂碼，那么該怎么解決呢？假設(shè)網(wǎng)頁源代碼是GB2312而想要的是utf-8，則可以用這句代碼 s.decode('GB2312').encode('utf-8') 因為字符串在Python內(nèi)部的表示是unicode編碼. 因此，在做編碼轉(zhuǎn)換時，通常需要以unicode作為中間編碼，即先將其他編碼的字符串解碼（decode）成unicode，再從unicode編碼（encode）成另一種編碼。

可是！就是有些網(wǎng)頁啊～口不對心，charset顯示的編碼和實際編碼跟不一樣，怪不得有UnicodeEncodeError[捂臉] 這時候就可以用下面的代碼來查看字符串的真實編碼，然后再decode和encode就好啦

import chardetPRint chardet.detect(data) # data是未知編碼的字符串

上一篇：Python 日期和時間

下一篇：Python 文件操作

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機(jī)V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實價值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術(shù)團(tuán)隊

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：江源县| 铜山县| 弥渡县| 宁津县| 山阴县| 馆陶县| 突泉县| 永春县| 伽师县| 绥中县| 辽源市| 江华| 宣化县| 林周县| 会理县| 冕宁县| 宝丰县| 监利县| 清苑县| 丘北县| 齐河县| 芦山县| 七台河市| 泸西县| 定结县| 加查县| 咸宁市| 绥宁县| 靖边县| 平遥县| 化德县| 棋牌| 台东市| 镇安县| 普宁市| 大安市| 凤阳县| 茂名市| 西昌市| 嘉鱼县| 临安市|

^{<noscript id="2qdix"></noscript>}