国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python中文編碼問題小結

2019-11-25 18:10:50
字體:
來源:轉載
供稿:網友

中文編碼問題一直是Python程序設計中很頭痛的問題,本文對此較為詳細的進行了總結歸納。具體如下:
 
當字符串是:'/u4e2d/u56fd' 

>>>s=['/u4e2d/u56fd','/u6e05/u534e/u5927/u5b66']>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")>>>print str中國

當字符串是:' 东亚学团一中'

>>>print unichr(19996)東

ord()支持unicode,可以顯示特定字符的unicode號碼,如:

>>>print ord('A')65

只要和Unicode連接,就會產生Unicode字串。如:

>>> 'help''help'>>> 'help,' + u'python'   u'help,python'

對于ASCII(7位)兼容的字串,可和內置的str()函數把Unicode字串轉換成ASCII字串。如:

>>> str(u'hello world')'hello world'

對幾個概念的理解:

ASCII碼 用數據字 對應 相應的字符 如下圖所示:

而中文 就是區位碼對應漢字。如:“好” 的ASCII碼為: 22909
 
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內有 gbk,gb2312,
 
utf-8是基于unicode的 國際化的場合適合使用

gb2312和gb2312都是國標碼 出現的較早 主要用于編解碼常用漢字

希望本文所述對大家的Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 东乌珠穆沁旗| 穆棱市| 博爱县| 厦门市| 呈贡县| 沈丘县| 桓台县| 承德县| 光山县| 吴旗县| 上犹县| 长武县| 扎兰屯市| 永德县| 延庆县| 大埔区| 双城市| 潼关县| 响水县| 兴文县| 诸城市| 兴仁县| 临武县| 阳曲县| 盐源县| 廊坊市| 辉县市| 聂荣县| 梨树县| 上犹县| 灵宝市| 禹城市| 拜城县| 隆尧县| 靖宇县| 合阳县| 乐东| 纳雍县| 建水县| 琼结县| 阿图什市|