中文編碼問題一直是Python程序設計中很頭痛的問題,本文對此較為詳細的進行了總結歸納。具體如下:
當字符串是:'/u4e2d/u56fd'
>>>s=['/u4e2d/u56fd','/u6e05/u534e/u5927/u5b66']>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")>>>print str中國當字符串是:' 东亚学团一中'
>>>print unichr(19996)東
ord()支持unicode,可以顯示特定字符的unicode號碼,如:
>>>print ord('A')65只要和Unicode連接,就會產生Unicode字串。如:
>>> 'help''help'>>> 'help,' + u'python' u'help,python'
對于ASCII(7位)兼容的字串,可和內置的str()函數把Unicode字串轉換成ASCII字串。如:
>>> str(u'hello world')'hello world'
對幾個概念的理解:
ASCII碼 用數據字 對應 相應的字符 如下圖所示:

而中文 就是區位碼對應漢字。如:“好” 的ASCII碼為: 22909
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內有 gbk,gb2312,
utf-8是基于unicode的 國際化的場合適合使用
gb2312和gb2312都是國標碼 出現的較早 主要用于編解碼常用漢字
希望本文所述對大家的Python程序設計有所幫助。
新聞熱點
疑難解答
圖片精選