国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python 登錄網站詳解及實例

2019-11-25 16:15:15
字體:
來源:轉載
供稿:網友

Python 登錄網站詳解及實例

對于大部分論壇,我們想要抓取其中的帖子分析,首先需要登錄,否則無法查看。

  這是因為 HTTP 協議是一個無狀態(Stateless)的協議,服務器如何知道當前請求連接的用戶是否已經登錄了呢?有兩種方式:

  1. 在URI 中顯式地使用 Session ID;
  2. 利用 Cookie,大概過程是登錄一個網站后會在本地保留一個 Cookie,當繼續瀏覽這個網站的時候,瀏覽器會把 Cookie 連同地址請求一起發送過去。

  Python 提供了相當豐富的模塊,所以對于這種網絡操作只要幾句話就可以完成。我以登錄 QZZN 論壇為例,事實上下面的程序幾乎所有的 PHPWind 類型的論壇都是適用的。

# -*- coding: GB2312 -*-from urllib import urlencodeimport cookielib, urllib2# cookiecj = cookielib.LWPCookieJar()opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))urllib2.install_opener(opener)# Loginuser_data = {'pwuser': '你的用戶名',       'pwpwd': '你的密碼',       'step':'2'      }url_data = urlencode(user_data)login_r = opener.open("http://bbs.qzzn.com/login.php", url_data)

 一些注釋:

  • urllib2 顯然是比 urllib 高級一點的模塊,里面包括了如何使用 Cookies。
  • 在 urllib2 中,每個客戶端可以用一個 opener 來抽象,每個 opener 又可以增加多個 handler 來增強其功能。
  • 在構造 opener 時指定了 HTTPCookieProcessor 做為 handler,因此這個 handler 支持 Cookie。
  • 使用 isntall_opener 后,調用 urlopen 時會使用這個 opener。
  • 如果不需要保存 Cookie,cj 這個參數可以省略。
  • user_data 存放的就是登錄所需要的信息,在登錄論壇的時候把這個信息傳遞過去就行了。
  • urlencode 功能是把字典 user_data 編碼成"?pwuser=username&pwpwd=password"的形式,這樣做是為了使程序易讀一些。

  最后一個問題是,pwuser、pwpwd 這類的名字是從哪兒來的,這就要分析需要登錄的網頁了。我們知道,一般的登錄界面都是一個表單,節選如下:

<form action="login.php?" method="post" name="login" onSubmit="this.submit.disabled = true;"> <input type="hidden" value="" name="forward" /> <input type="hidden" value="http://bbs.qzzn.com/index.php" name="jumpurl" /> <input type="hidden" value="2" name="step" /> ... <td width="20%" onclick="document.login.pwuser.focus();"><input type="radio" name="lgt" value="0" checked />用戶名 <input type="radio" name="lgt" value="1" />UID</td> <td><input class="input" type="text" maxLength="20" name="pwuser" size="40" tabindex="1" /> <a href="reg1ster.php" rel="external nofollow" >馬上注冊</a></td> <td>密 碼</td> <td><input class="input" type="password" maxLength="20" name="pwpwd" size="40" tabindex="2" /> <a href="sendpwd.php" rel="external nofollow" target="_blank">找回密碼</a></td> ... </form>

  從這里可以看出,我們需要輸入的用戶名密碼對應的就是 pwuser 和 pwpwd,而 step 對應的則是登錄(這個是嘗試出來的)。

  注意到,這個論壇表單采用的是 post 方式,如果是 get 方式則本文的方法就需要變動一下,不能直接 open,而是應該首先 Request,然后再 open。更詳細的請看手冊...

感謝閱讀,希望能幫助到大家,謝謝大家對本站的支持!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 青州市| 宝鸡市| 孝感市| 和林格尔县| 邹城市| 平和县| 双桥区| 常山县| 沂源县| 达孜县| 荔浦县| 咸阳市| 泸定县| 赣榆县| 奈曼旗| 长丰县| 沂源县| 台南县| 鄱阳县| 临夏市| 清涧县| 和政县| 民丰县| 安泽县| 渭南市| 西青区| 五常市| 宿迁市| 高安市| 东港市| 宕昌县| 德江县| 祥云县| 开化县| 渭源县| 荆门市| 永靖县| 托里县| 故城县| 江门市| 环江|