前言
國家統計局網站上有相對比較齊的行政區劃碼,對于一些網站來說這是非?;A的數據,所以寫了個Python程序將這部分數據抓取下來。
注意:抓取下來以后還要進行簡單的人工的整理
示例代碼:
# -*- coding:utf-8 -*-'''獲取國家統計局上的行政區劃碼'''import requests,rebase_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html' def get_xzqh(): html_data = requests.get(base_url).content pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(/d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>') areas = re.findall(pattern,html_data) print "code,name,level" for area in areas: print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ') if __name__=='__main__': get_xzqh()注意事項:
另外,關于國家地區表的信息,還有另外一種獲取渠道,那就是QQ軟件自帶的國家地區信息表。(文件名為LocList.xml),一般的存儲位置為:C:/Program Files/Tencent/QQ/I18N/2052
如需中文版安裝中文版QQ即可獲取,如需英文版則安裝英文版QQ。國際版在1033目錄。
code都是按照ISO3166標準寫的,極易導入數據庫。
總結
以上就是利用Python獲取行政區劃碼的全部內容,希望本文的內容對大家學習或者使用python能有所幫助,如果有疑問大家可以留言交流。
新聞熱點
疑難解答
圖片精選