国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python2中文處理紀(jì)要的實現(xiàn)方法

2020-02-22 23:24:07
字體:
供稿:網(wǎng)友

python2不是以unicode作為基本代碼字符類型,碰到亂碼的幾率是遠(yuǎn)遠(yuǎn)高于python3,但即便如此,相信很多人,也不想隨意的遷移到python3,這里就總結(jié)幾個我平常碰到的問題及解法。

1、文件中無法使用中文注釋

處理方法:

在代碼中增加 # -*- coding=UTF-8 -*- ,一般加在文件頭部第一行,如果第一行是腳本標(biāo)志,則放在第二行(實際仍然是python正本的第一行)。

隨后將文件另存為UTF-8格式。

此方法可以解決注釋中有中文,及字符串立即數(shù)中包含中文的問題。

2、unicode中文變量打印出來是亂碼

處理方法:

文件開始引入擴展庫的部分加入以下3行代碼。

import sysreload(sys)sys.setdefaultencoding('utf-8')

3、utf-8 及 gbk互相轉(zhuǎn)換

直接看代碼:

#utf-8字符串轉(zhuǎn)換成GBK(GB2312及其它編碼也是這樣用)print str.decode('UTF-8').encode('GBK')#gbk轉(zhuǎn)換成utf-8print str.decode('GBK').encode('UTF-8')

4、參數(shù)中的utf-8是用大寫還是小寫?

通常大小寫都可以,這不是python決定的,是系統(tǒng)的語言代碼設(shè)定決定的。

5、打開utf-8的文本文件

經(jīng)過1、2的設(shè)置,正常直接打開就可以,文件是什么編碼,讀出來就是什么編碼,個別仍有不行的可以使用擴展庫codecs:

import codecs...with codecs.open(poetry_file, "r","utf-8") as f:

6、print打印出來的結(jié)構(gòu)中的漢字是亂碼

print僅打印一個utf-8的變量是不會有問題的,比如

a="漢字"print a#會正常顯示

但是如果用了接續(xù)顯示,比如:

print a,#將會顯示亂碼

如果是其它結(jié)構(gòu),諸如dict / list / class等,都會出現(xiàn)亂碼。

a = ["中文","測試"]print a#將會顯示亂碼

這種情況使用基本庫沒有什么好辦法,只能循環(huán)逐個打印內(nèi)容,比如:

...for item in items:print item

或者整合輸出,比如: print ', '.join(a)

還可以使用第三方的包,比如:

import uniout...listnine = ['梨', '橘子', '蘋果', '香蕉']print 'listnine list: %s' % listnine

7、變量本身顯示正常,循環(huán)遍歷出來的單個字符亂碼

大多情況是因為字符串不是unicode編碼。聲明字符串的時候使用 a = u'漢字' 這樣方式賦值的變量都是Unicode字符串,不會有問題。

如果是從外部傳入的變量,源頭情況又不知道,可以嘗試轉(zhuǎn)換成Unicode字符串:

str=unicode(str,"utf-8");

嗯,差不多就這些,想到再補充。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 壤塘县| 蛟河市| 万安县| 宣城市| 房产| 昌宁县| 皮山县| 佛冈县| 中西区| 栾城县| 随州市| 阿克陶县| 鄢陵县| 巴林左旗| 朝阳县| 白朗县| 永丰县| 虞城县| 雅江县| 博罗县| 太原市| 临泉县| 新兴县| 饶阳县| 台东县| 沅江市| 福安市| 龙山县| 马尔康县| 定兴县| 甘德县| 广南县| 城口县| 潮州市| 竹溪县| 嘉黎县| 临夏县| 临沧市| 汨罗市| 宜章县| 穆棱市|