Python 爬蟲之超鏈接 url中含有中文出錯及解決辦法
python3.5 爬蟲錯誤:
UnicodeEncodeError: 'ascii' codec can't encode characters
這個錯誤是由于超鏈接中含有中文引起的,超鏈接默認是用ascii編碼的,所以不能直接出現中文,若要出現中文,
解決方法如下:
import urllib from urllib.request import urlopenlink="http://list.jd.com/list.html?cat=9987,653,655&ev=exbrand%5F9420&trans=1&JL=3_品牌_金立(Gionee)" #含有中文的超鏈接# 需要用 urllib.parse.quote 轉換link=urllib.parse.quote(link)html=urlopen(link).read() #就可以訪問了,不會報異常
以上就是 Python 爬蟲出現錯誤解決辦法的詳解,如有疑問請留言或者到本站的社區(qū)交流討論,感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!
新聞熱點
疑難解答