国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲之Selenium+PhantomJS組合

2019-11-08 03:14:48
字體:
來源:轉載
供稿:網友

簡介

一直以來我們在使用Python的urllib2、httplib等通信框架來抓取網頁,但是涉及到javaScript渲染的頁面卻不能抓取,所以采用Web自動化測試工具Selenium,無界面瀏覽器PhantomJS來抓取Javascript渲染的頁面,帶我們熟悉使用后,爬蟲技能將大大提升。

Selenium是一個用于Web應用程序測試的工具。Selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。Selenium支持的瀏覽器包括IE、Mozilla Firefox、Chrome等。 Selenium支持多種語言開發,比如 Java,Python, C,Ruby等。 #Phantom JS是一個服務器端的 JavaScript API 的 WebKit。其支持各種Web標準: DOM 處理, CSS 選擇器, JSON, Canvas, 和 SVG。 #

首先安裝 Python 的 Selenium 庫,再安裝好 PhantomJS,就可以實現 Python+Selenium+PhantomJS 的無縫對接了嘛!PhantomJS 用來渲染解析JS,Selenium 用來驅動PhantomJS以及與 Python 的對接,Python 進行網頁后期的處理,完美的三劍客!

Win7 64位軟件環境:

安裝Python 2.7安裝Python setuptool安裝Ptyhon pip安裝Selenium #安裝PhantomJS,切換到Python安裝目錄下Script目錄下執行命令:pip install -U selenium 安裝PhantomJS,下載解壓即可

Selenium+PhantomJS示例

使用方法很簡單,代碼如下,如果成功打印出網頁的源碼,那么說明已經可以成功使用了。

from selenium import webdriver#driver = webdriver.PhantomJS()driver.get('http://wenshu.court.gov.cn/list/list/')data = driver.page_sourcePRint datadriver.quit()
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 平乐县| 承德县| 怀化市| 盐源县| 大关县| 漳州市| 建德市| 弋阳县| 枣强县| 桐庐县| 句容市| 綦江县| 高邑县| 桃源县| 龙江县| 嘉荫县| 原阳县| 垦利县| 白水县| 麻江县| 阿克苏市| 连云港市| 丰县| 靖边县| 乌拉特后旗| 赤水市| 涡阳县| 江城| 湖北省| 色达县| 临清市| 蒙阴县| 嘉鱼县| 西城区| 临泽县| 高安市| 襄汾县| 澄江县| 平阴县| 石泉县| 博爱县|