国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python urllib urlopen()對象方法/代理的補充說明

2019-11-25 16:03:46
字體:
供稿:網(wǎng)友

python urllib urlopen()對象方法/代理的補充說明

urllib 是 python 自帶的一個抓取網(wǎng)頁信息一個接口,他最主要的方法是 urlopen(),是基于 python 的 open() 方法的。下面是主要說明:

urllib.urlopen('網(wǎng)址')

這里傳入urlopen()的參數(shù)有特別說要求,要遵循一些網(wǎng)絡協(xié)議,比如http,ftp,也就是說,在網(wǎng)址的開頭必須要有http://這樣的說明,如:urllib.urlopen('http://www.baidu.com')。

要么就是本地文件,本地文件需要使用file關鍵字,比如 urllib.urlopen('file:nowamagic.py'),注意,這里的hello.py是指的是當前的classpath所指定的內(nèi)容,如果對hello.py這里有什么疑問那一定是python尋找classpath的順序不是很清楚了,當然也可以直接寫全部路徑,urllib.urlopen('file:F:/pythontest/nowamagic.py')。

打開 ftp 文件也是可以的,寫法 urllib.urlopen(url='ftp://用戶名:密碼@ftp地址/') 等。

示例程序:

import urllibf = urllib.urlopen('file:F:/pythontest/nowamagic.py')a = f.read()print a

如果傳入的參數(shù)正確,比如該網(wǎng)站可以訪問,沒有特殊情況(比如需要代理,被墻等),那么將返回一個類似于文件對象的對象。即上面代碼中的f,f對象有的方法一些操作方法,使用dir(f):

['__doc__', '__init__', '__iter__', '__module__', '__repr__', 'close', 'fileno', 'fp', 'geturl', 'headers', 'info', 'next', 'read', 'readline', 'readlines', 'url']

使用read()方法會將所有內(nèi)容讀取出來,并且同時f對象類似于先入先出的數(shù)據(jù),在使用f.read()將得不到任何數(shù)據(jù),也就是說,得到的數(shù)據(jù)在這個時候如果想在后面進行任何處理操作的話,需要另外定義一個對象來進行存儲。如上例中的a。而info(),geturl()方法,也是基于f這個文檔對象的,所以,使用

>>>f.geturl() 'F://pythontest//nowamagic.py'

接下來是urllib的代理設置:

import urllibproxies = {'http':'http://***.***.***.***:1984'}filehandle = urllib.urlopen('http://www.需要代理才能訪問的網(wǎng)站.com/',proxies = proxies)a = filehandle.read()print a

以上是最基本代理,即代理訪問到該網(wǎng)站,并且能夠獲得該網(wǎng)站的內(nèi)容。但是如果遇到需要登錄,或者需要cookie等的網(wǎng)站呢?

查看urllib的源碼:

def urlopen(url, data=None, proxies=None):  """urlopen(url [, data]) -> open file-like object"""  global _urlopener  if proxies is not None:    opener = FancyURLopener(proxies=proxies)  elif not _urlopener:    opener = FancyURLopener()    _urlopener = opener  else:    opener = _urlopener  if data is None:    return opener.open(url)  else:    return opener.open(url, data)

由上面urllib的urlopen的源碼,可以看出,還可以傳入一個data參數(shù),data參數(shù)也應該是一個字典,因為在使用瀏覽器向服務器發(fā)送數(shù)據(jù)的時候,我們發(fā)送的就是字典類型的數(shù)據(jù)。

還有一點,就是代理支持是 python 2.3 以后加入的。

感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 漳浦县| 夏河县| 台湾省| 乌拉特中旗| 凌源市| 嘉义县| 甘德县| 会泽县| 定南县| 桑日县| 上思县| 盐津县| 绍兴市| 连平县| 岳阳市| 平阴县| 平顺县| 天柱县| 汾西县| 陆丰市| 思茅市| 银川市| 囊谦县| 罗城| 密云县| 台湾省| 吉木乃县| 天等县| 建瓯市| 墨江| 普宁市| 蓬莱市| 呼图壁县| 黄平县| 库伦旗| 昭觉县| 宜兰县| 洞头县| 万宁市| 竹山县| 岳阳市|