国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python訪問抓取網(wǎng)頁常用命令總結(jié)

2020-02-23 04:32:41
字體:
供稿:網(wǎng)友

python訪問抓取網(wǎng)頁常用命令

簡單的抓取網(wǎng)頁:

import urllib.request  url="http://google.cn/" response=urllib.request.urlopen(url)  #返回文件對象page=response.read() 

直接將URL保存為本地文件:

import urllib.request  url="http://google.cn/" response=urllib.request.urlopen(url)  #返回文件對象page=response.read() 

POST方式:

import urllib.parse import urllib.request  url="http://liuxin-blog.appspot.com/messageboard/add"  values={"content":"命令行發(fā)出網(wǎng)頁請求測試"} data=urllib.parse.urlencode(values) #創(chuàng)建請求對象 req=urllib.request.Request(url,data) #獲得服務(wù)器返回的數(shù)據(jù) response=urllib.request.urlopen(req) #處理數(shù)據(jù) page=response.read() 

GET方式:

import urllib.parse import urllib.request  url="http://www.google.cn/webhp"  values={"rls":"ig"} data=urllib.parse.urlencode(values)  theurl=url+"?"+data #創(chuàng)建請求對象 req=urllib.request.Request(theurl) #獲得服務(wù)器返回的數(shù)據(jù) response=urllib.request.urlopen(req) #處理數(shù)據(jù) page=response.read() 

有2個常用的方法,geturl(),info()

geturl()的設(shè)置是為了辨別是否有服務(wù)器端的網(wǎng)址重定向,而info()則包含了一系列的信息。

中文問題的處理,會用到 encode()編碼 dencode()解碼:

感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 永清县| 定结县| 芜湖市| 于田县| 平江县| 吉林市| 灵宝市| 鸡泽县| 当雄县| 中阳县| 玉山县| 儋州市| 盐边县| 吴川市| 阜康市| 宜兰县| 高陵县| 长子县| 宣武区| 昂仁县| 清苑县| 汉源县| 黄骅市| 虹口区| 尼木县| 右玉县| 金坛市| 广昌县| 和平县| 巫山县| 赣州市| 永川市| 虞城县| 勃利县| 藁城市| 永福县| 西乌| 温宿县| 乐都县| 香格里拉县| 泾阳县|