国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python 遍歷字符串(含漢字)實例詳解

2019-11-25 16:16:00
字體:
供稿:網(wǎng)友

python 遍歷字符串(含漢字)實例詳解

s = "中國china"for j in s:  print j

首先一個,你這個'a'是什么編碼?可能不是你所想的gbk

>>> a='中國'>>> a

這樣試試看,如果出來是6個字(word),說明是utf-8,如果是4個字,說明gbk。

另外,不管是utf-8還是gbk,都不能這樣遍歷,因為這里它會一個字一個字拿出來。虛擬機把a當成一個長度為len(a)的字符串了。

接下來是遍歷問題。

Linux的shell大都默認是utf-8,所以一個中文字符是三個字,所以要三個三個地讀,你可以試下:

>>> a[:3]

出來就是個”中”字

windows的command的默認是cp936,也就是gbk,一個中文字符是兩個字,所以兩個字兩個字地讀(a[:2])。

還有另一種遍歷的方法,把字符串轉(zhuǎn)換成unicode,這樣中文英文都是一個字,就可以用你的for i in a的方法遍歷了。這個的好處是中文英文字符都是一個字,而utf-8和gbk里,英文字母只占一個字。

s = u"中國china"for j in s:  print j

輸出如下:

中國china

感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 平江县| 米脂县| 宿州市| 锡林浩特市| 洛扎县| 临颍县| 漳平市| 和田县| 尼木县| SHOW| 边坝县| 六枝特区| 云南省| 蛟河市| 都安| 道孚县| 东源县| 临湘市| 建平县| 拉萨市| 府谷县| 塘沽区| 图片| 西乡县| 明水县| 洞口县| 庆阳市| 乌兰浩特市| 石城县| 龙州县| 遂宁市| 开阳县| 茌平县| 阳城县| 曲沃县| 监利县| 昭通市| 固始县| 衡东县| 依兰县| 土默特右旗|