本文實例講述了python實現中文轉換url編碼的方法。分享給大家供大家參考,具體如下:
今天要處理百度貼吧的東西。想要做一個關鍵詞的list,每次需要時,直接添加 到list里面就可以了。但是添加到list里面是中文的情況(比如‘麗江'),url的地址編碼卻是'%E4%B8%BD%E6%B1%9F',因此需 要做一個轉換。這里我們就用到了模塊urllib。
>>> import urllib>>> data = '麗江'>>> print data麗江>>> data'/xe4/xb8/xbd/xe6/xb1/x9f'>>> urllib.quote(data)'%E4%B8%BD%E6%B1%9F'
那我們想轉回去呢?
>>> urllib.unquote('%E4%B8%BD%E6%B1%9F')'/xe4/xb8/xbd/xe6/xb1/x9f'>>> print urllib.unquote('%E4%B8%BD%E6%B1%9F')麗江細心的同學會發現貼吧url中出現的是%C0%F6%BD%AD,而非'%E4%B8%BD%E6%B1%9F',其實是編碼問題。百度的是gbk,其他的一般網站比如google就是utf8的。所以可以用下列語句實現。
>>> import sys,urllib >>> s = '麗江'>>> urllib.quote(s.decode(sys.stdin.encoding).encode('gbk'))'%C0%F6%BD%AD'>>> urllib.quote(s.decode(sys.stdin.encoding).encode('utf8'))'%E4%B8%BD%E6%B1%9F'>>>更多關于Python相關內容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結》、《Python數據結構與算法教程》、《Python Socket編程技巧總結》、《Python函數使用技巧總結》、《Python字符串操作技巧匯總》、《Python入門與進階經典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對大家Python程序設計有所幫助。
新聞熱點
疑難解答
圖片精選