python中urllib模塊用法實(shí)例詳解

2019-11-25 18:05:24

字體：大中小

供稿：網(wǎng)友

本文實(shí)例講述了python中urllib模塊用法。分享給大家供大家參考。具體分析如下：

一、問(wèn)題：

近期公司項(xiàng)目的需求是根據(jù)客戶(hù)提供的api，我們定時(shí)去獲取數(shù)據(jù)，之前的方案是用php收集任務(wù)存入到redis隊(duì)列，然后在linux下做一個(gè)常駐進(jìn)程跑某一個(gè)php文件，該php文件就一個(gè)無(wú)限循環(huán)，判斷redis隊(duì)列，有就執(zhí)行，沒(méi)有就break.

二、解決方法：

最近剛好學(xué)了一下python, python的urllib模塊或許比php的curl更快，而且簡(jiǎn)單. 貼一下代碼

復(fù)制代碼代碼如下:

#_*_ coding:utf-8 _*_
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )
import os
import json
from urllib import urlopen
doc = urlopen("http://xxxx?webid=1&tid=901&cateid=101").read()
doc = json.loads(doc)
print doc
print doc.keys()
print doc["msg"]
print doc['data']
print doc['ret']

發(fā)現(xiàn)第一次訪(fǎng)問(wèn)所需要的時(shí)間為[Finished in 3.0s]
而第二次訪(fǎng)問(wèn)的時(shí)間為[Finished in 0.2s]
可見(jiàn)python的urllib模塊是加有緩存的
urllib/2用法典型的例子

復(fù)制代碼代碼如下:

    import urllib2
    import cookielib
    import urllib

    class Hi_login:
        def __init__(self):
            cookie = cookielib.CookieJar()
            self.cookie = urllib2.HTTPCookieProcessor(cookie) ##### 生成cookie ###

        def login(self,user,pwd):
            url='http://passport.baidu.com/?login'
            postdata=urllib.urlencode({
          'mem_pass':'on',

          'password':pwd
           'Submit':'',
          'tpl':'sp',
          'tp_reg':'sp',
          'u' :'http://hi.baidu.com',
          'username':user})
            ### proxy_support = urllib2.ProxyHandler({"http":"http://ahad-haam:3128"}) 然后加入opener方法里####
            opener = urllib2.build_opener(self.cookie) ### 使用cookie ###
            headers = { ####### dict結(jié)構(gòu)，可以加入x-forward-for甚至refer等 #######
           'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
            urllib2.install_opener(opener)
            request = urllib2.Request(url,urllib.urlencode(postdata),headers = headers)
            urllib2.urlopen(request)
    if __name__=='__main__':
       pwd='123456'
       user='xiaofu'
       test=Hi_login()
       test.login(user,pwd)

假如訪(fǎng)問(wèn)需要認(rèn)證的頁(yè)面比如nagios監(jiān)控頁(yè)面等，

復(fù)制代碼代碼如下:

    import urllib2
    password_mgr = urllib2.HTTPPasswordMgrWithDefaultRealm()
    url = "http://202.1.x.y/nagios"
    password_mgr.add_password(None, url, user='abc',passwd='xxxxxx')
    handler = urllib2.HTTPBasicAuthHandler(password_mgr)
    opener = urllib2.build_opener(handler)
    urllib2.install_opener(opener)
    f=urllib2.urlopen(url)
    print f.code

返回結(jié)果200，否則就是401認(rèn)證錯(cuò)誤

希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。

上一篇：Python提示[Errno 32]Broken pipe導(dǎo)致線(xiàn)程crash錯(cuò)誤解決方法

下一篇：python統(tǒng)計(jì)一個(gè)文本中重復(fù)行數(shù)的方法