国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

php curl模塊模擬登錄后采集頁面實例

2024-05-04 21:47:29
字體:
來源:轉載
供稿:網友

在php中curl模塊是一個多線程的模塊,他可以很方便的實現模擬登錄,如post,get都可以,下面我來舉一個實例利用curl模塊模擬登錄后采集頁面程序.

今天接到的功課是從一個網站獲取商品庫存,但是這個網站需要登錄,我用fsockopen傳遞了整個header頭都沒用,只能求助于curl了。

附帶說一下curl模塊的開啟辦法:

(1)從php目錄下拷貝:libeay32.dll,ssleay32.dll 到windows目錄下。

(2)打開php.ini,查找“extension_dir = xxxxx”,確認后面的文件目錄內有php_curl.dll文件。

(3)同樣是php.ini,查找“extension=php_curl.dll”,確認它沒有被注釋(前面沒有';')。

(4)重啟apache,如果使用curl_init();語句出現錯誤提示,則說明沒有安裝成功。

例,代碼如下:

  1. $curl = curl_init(); 
  2. $cookie_jar = tempnam('./tmp','cookie'); 
  3. curl_setopt($curl, CURLOPT_URL,'http://m.survivalescaperooms.com/  checkUser.jsp');//這里寫上處理登錄的界面 
  4. curl_setopt($curl, CURLOPT_POST, 1); 
  5. $request = 'user=xxx&password=xxx'
  6. curl_setopt($curl, CURLOPT_POSTFIELDS, $request);//傳 遞數據 
  7. curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie_jar);// 把返回來的cookie信息保存在$cookie_jar文件中 
  8. curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);//設定返回 的數據是否自動顯示 
  9. curl_setopt($curl, CURLOPT_HEADER, false);//設定是否顯示頭信 息 
  10. curl_setopt($curl, CURLOPT_NOBODY, false);//設定是否輸出頁面 內容 
  11. curl_exec($curl);//返回結果 
  12. curl_close($curl); //關閉 
  13. $curl2 = curl_init(); 
  14. curl_setopt($curl2, CURLOPT_URL, 'http://m.survivalescaperooms.com/ aaa.php');//登陸后要從哪個頁面獲取信息 
  15. curl_setopt($curl2, CURLOPT_HEADER, false); 
  16. curl_setopt($curl2, CURLOPT_RETURNTRANSFER, 1); 
  17. curl_setopt($curl2, CURLOPT_COOKIEFILE, $cookie_jar); 
  18. $content = curl_exec($curl2); 

這樣就把獲得的數據作為字符串傳遞到$content了,然后對字符串進行處理,刪掉沒必要的部分,我只刪除了頁面前端沒必要的部分,代碼如下刪除掉:

  1. $content = strstr($orders,'<div class="products">');//查找首次出現 
  2. <div class="products"

CURL參數詳解:

bool curl_setopt (int ch, string option, mixed value)

curl_setopt()函數將為一個CURL會話設置選項,option參數是你想要的設置,value是這個選項給定的值。

下列選項的值將被作為長整形使用(在option參數中指定):

*CURLOPT_INFILESIZE: 當你上傳一個文件到遠程站點,這個選項告訴PHP你上傳文件的大小。

*CURLOPT_VERBOSE: 如果你想CURL報告每一件意外的事情,設置這個選項為一個非零值。

*CURLOPT_HEADER: 如果你想把一個頭包含在輸出中,設置這個選項為一個非零值。

*CURLOPT_NOPROGRESS: 如果你不會PHP為CURL傳輸顯示一個進程條,設置這個選項為一個非零值。

注意:PHP自動設置這個選項為非零值,你應該僅僅為了調試的目的來改變這個選項。

*CURLOPT_NOBODY: 如果你不想在輸出中包含body部分,設置這個選項為一個非零值。

*CURLOPT_FAILONERROR: 如果你想讓PHP在發生錯誤(HTTP代碼返回大于等于300)時,不顯示,設置這個選項為一人非零值。默認行為是返回一個正常頁,忽略代碼。

*CURLOPT_UPLOAD: 如果你想讓PHP為上傳做準備,設置這個選項為一個非零值。

*CURLOPT_POST: 如果你想PHP去做一個正規的HTTP POST,設置這個選項為一個非零值,這個POST是普通的 application/x-www-from-urlencoded 類型,多數被HTML表單使用。

*CURLOPT_FTPLISTONLY: 設置這個選項為非零值,PHP將列出FTP的目錄名列表。

*CURLOPT_FTPAPPEND: 設置這個選項為一個非零值,PHP將應用遠程文件代替覆蓋它。

*CURLOPT_NETRC: 設置這個選項為一個非零值,PHP將在你的 ~./netrc 文件中查找你要建立連接的遠程站點的用戶名及密碼。

*CURLOPT_FOLLOWLOCATION: 設置這個選項為一個非零值(象 “Location: “)的頭,服務器會把它當做HTTP頭的一部分發送(注意這是遞歸的,PHP將發送形如 “Location: “的頭)。

*CURLOPT_PUT: 設置這個選項為一個非零值去用HTTP上傳一個文件。要上傳這個文件必須設置CURLOPT_INFILE和CURLOPT_INFILESIZE選項.

*CURLOPT_MUTE: 設置這個選項為一個非零值,PHP對于CURL函數將完全沉默。

*CURLOPT_TIMEOUT: 設置一個長整形數,作為最大延續多少秒。

*CURLOPT_LOW_SPEED_LIMIT: 設置一個長整形數,控制傳送多少字節。

*CURLOPT_LOW_SPEED_TIME: 設置一個長整形數,控制多少秒傳送CURLOPT_LOW_SPEED_LIMIT規定的字節數。

*CURLOPT_RESUME_FROM: 傳遞一個包含字節偏移地址的長整形參數,(你想轉移到的開始表單)。

*CURLOPT_SSLVERSION: 傳遞一個包含SSL版本的長參數。默認PHP將被它自己努力的確定,在更多的安全中你必須手工設置。

*CURLOPT_TIMECONDITION: 傳遞一個長參數,指定怎么處理CURLOPT_TIMEVALUE參數。你可以設置這個參數為TIMECOND_IFMODSINCE 或 TIMECOND_ISUNMODSINCE。這僅用于HTTP。

*CURLOPT_TIMEVALUE: 傳遞一個從1970-1-1開始到現在的秒數。這個時間將被CURLOPT_TIMEVALUE選項作為指定值使用,或被默認TIMECOND_IFMODSINCE使用。

下列選項的值將被作為字符串: 

*CURLOPT_URL: 這是你想用PHP取回的URL地址。你也可以在用curl_init()函數初始化時設置這個選項。

*CURLOPT_USERPWD: 傳遞一個形如[username]:[password]風格的字符串,作用PHP去連接。

*CURLOPT_PROXYUSERPWD: 傳遞一個形如[username]:[password] 格式的字符串去連接HTTP代理。

*CURLOPT_RANGE: 傳遞一個你想指定的范圍。它應該是”X-Y”格式,X或Y是被除外的。HTTP傳送同樣支持幾個間隔,用逗句來分隔(X-Y,N-M)。

*CURLOPT_POSTFIELDS: 傳遞一個作為HTTP “POST”操作的所有數據的字符串。

*CURLOPT_REFERER: 在HTTP請求中包含一個”referer”頭的字符串。

*CURLOPT_USERAGENT: 在HTTP請求中包含一個”user-agent”頭的字符串。

*CURLOPT_FTPPORT: 傳遞一個包含被ftp “POST”指令使用的IP地址。這個POST指令告訴遠程服務器去連接我們指定的IP地址。這個字符串可以是一個IP地址,一個主機名,一個網絡界面名(在UNIX下),或是‘-’(使用系統默認IP地址)。

*CURLOPT_COOKIE: 傳遞一個包含HTTP cookie的頭連接。

*CURLOPT_SSLCERT: 傳遞一個包含PEM格式證書的字符串。

*CURLOPT_SSLCERTPASSWD: 傳遞一個包含使用CURLOPT_SSLCERT證書必需的密碼。

*CURLOPT_COOKIEFILE: 傳遞一個包含cookie數據的文件的名字的字符串。這個cookie文件可以是Netscape格式,或是堆存在文件中的HTTP風格的頭。

*CURLOPT_CUSTOMREQUEST: 當進行HTTP請求時,傳遞一個字符被GET或HEAD使用。為進行DELETE或其它操作是有益的,更Pass a string to be used instead of GET or HEAD when doing an HTTP request. This is useful for doing or another, more obscure, HTTP request.

注意:在確認你的服務器支持命令先不要去這樣做。

下列的選項要求一個文件描述(通過使用fopen()函數獲得):

*CURLOPT_FILE: 這個文件將是你放置傳送的輸出文件,默認是STDOUT.

*CURLOPT_INFILE: 這個文件是你傳送過來的輸入文件。

*CURLOPT_WRITEHEADER: 這個文件寫有你輸出的頭部分。

*CURLOPT_STDERR: 這個文件寫有錯誤而不是stderr。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 习水县| 屏南县| 迁西县| 平谷区| 辽阳县| 务川| 赣榆县| 牙克石市| 贡嘎县| 乌拉特后旗| 盘锦市| 沙雅县| 马边| 大化| 田东县| 桓台县| 江门市| 浪卡子县| 武隆县| 星子县| 彭泽县| 怀集县| 宜川县| 陈巴尔虎旗| 景洪市| 平顺县| 庆云县| 罗山县| 灌阳县| 新竹县| 页游| 永仁县| 武宁县| 兴山县| 遂昌县| 商南县| 民勤县| 密云县| 扎囊县| 常德市| 胶南市|