国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

利用Python抓取行政區(qū)劃碼的方法

2020-02-23 04:09:37
字體:
供稿:網(wǎng)友

前言

國(guó)家統(tǒng)計(jì)局網(wǎng)站上有相對(duì)比較齊的行政區(qū)劃碼,對(duì)于一些網(wǎng)站來說這是非常基礎(chǔ)的數(shù)據(jù),所以寫了個(gè)Python程序?qū)⑦@部分?jǐn)?shù)據(jù)抓取下來。

注意:抓取下來以后還要進(jìn)行簡(jiǎn)單的人工的整理

示例代碼:

# -*- coding:utf-8 -*-'''獲取國(guó)家統(tǒng)計(jì)局上的行政區(qū)劃碼'''import requests,rebase_url = 'http://www.stats.gov.cn/tjsj/tjbz/xzqhdm/201504/t20150415_712722.html' def get_xzqh(): html_data = requests.get(base_url).content pattern = re.compile('<p class="MsoNormal" style=".*?"><span lang="EN-US" style=".*?">(/d+)<span>.*?</span></span><span style=".*?">(.*?)</span></p>') areas = re.findall(pattern,html_data) print "code,name,level" for area in areas:  print area[0],area[1].decode('utf-8').replace(u' ',''),area[1].decode('utf-8').count(u' ') if __name__=='__main__': get_xzqh()

注意事項(xiàng):

另外,關(guān)于國(guó)家地區(qū)表的信息,還有另外一種獲取渠道,那就是QQ軟件自帶的國(guó)家地區(qū)信息表。(文件名為LocList.xml),一般的存儲(chǔ)位置為:C:/Program Files/Tencent/QQ/I18N/2052

如需中文版安裝中文版QQ即可獲取,如需英文版則安裝英文版QQ。國(guó)際版在1033目錄。

code都是按照ISO3166標(biāo)準(zhǔn)寫的,極易導(dǎo)入數(shù)據(jù)庫。

總結(jié)

以上就是利用Python獲取行政區(qū)劃碼的全部?jī)?nèi)容,希望本文的內(nèi)容對(duì)大家學(xué)習(xí)或者使用python能有所幫助,如果有疑問大家可以留言交流。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 三明市| 柳江县| 固阳县| 惠来县| 枣阳市| 凤冈县| 平南县| 广德县| 彰武县| 雅安市| 二连浩特市| 伊川县| 灵寿县| 东平县| 贵德县| 沛县| 葫芦岛市| 常熟市| 呼和浩特市| 民权县| 武城县| 沁源县| 汉沽区| 裕民县| 宜州市| 邢台市| 嘉善县| 巴里| 安平县| 神农架林区| 阿拉善盟| 延长县| 馆陶县| 藁城市| 页游| 阿巴嘎旗| 象山县| 天水市| 安庆市| 永清县| 改则县|