国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python寫爬蟲6-selenium的使用

2019-11-08 18:46:58
字體:
來源:轉載
供稿:網友

python寫爬蟲6-selenium的使用

目前,前端技術比較火熱。各種前端技術、框架層出不窮。大部分站點的數據都是異步動態加載,相比獲取靜態內容,要抓取動態內容稍微麻煩點

常用的兩種抓取動態網頁數據的方法: 1.借助Firebug等瀏覽工具,分析請求數據,獲得數據接口地址。然后直接動態改變接口參數,獲取json格式的數據。 2.使用瀏覽器渲染引擎觸發javascript事件,借助工具WebKit,Selenium

借助WebKit,我們可以自定義瀏覽器渲染引擎,這樣就能完全控制想要執行的行為,如果不需要這么靈活,那可借助Selenium,它提供了使瀏覽器自動化的API接口,本文簡單介紹Selenium的使用

環境 Mac python2.7 selenium3.0.2 Firefox51.0.1

1.需求

瀏覽器自動搜索北京趕集網 ‘亦莊’附近的租房信息

2.安裝selenium

pip install selenium (默認安裝最新版,我的是3.0.2)

現在直接調用selenium使用的話,會爆錯,且不能調動瀏覽器;stackoverflow.com有網友說用2.53.2(具體版本記不清了),這個版本能調起瀏覽器,但仍會爆錯,接著瀏覽器自動關閉。所以,還是直接用版本3吧。具體解決方法下面會講到

3.selenium依賴項

下載geckodriver 我下載的是geckodriver-v0.13.0-macos.tar.gz,將解壓后的文件放在你指定的目錄下,我放在了桌面上,如下圖: 這里寫圖片描述 下載地址 https://github.com/mozilla/geckodriver/releases 參考https://www.zhihu.com/question/49568096

4.編寫代碼

以北京趕集網為例:http://bj.ganji.com/fang1/ 分析此頁面: 這里寫圖片描述

#!/usr/bin/env python# -*- coding: utf-8 -*-from selenium import webdriverimport timedr = webdriver.Firefox(executable_path = '/Users/xxx/desktop/geckodriver')Word').send_keys(u'亦莊')dr.implicitly_wait(5)dr.find_element_by_id('search_button').click() # 模擬點擊time.sleep(5)dr.quit()print 'Browser is close'
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 理塘县| 平谷区| 海林市| 大安市| 利津县| 绍兴市| 邯郸市| 唐河县| 河源市| 剑川县| 阿尔山市| 巴里| 泸水县| 乐陵市| 肇州县| 白山市| 军事| 绵阳市| 洛阳市| 乳源| 堆龙德庆县| 金湖县| 绥德县| 阜新市| 梁平县| 石家庄市| 广水市| 清远市| 鹰潭市| 东阿县| 丰镇市| 通山县| 华安县| 武乡县| 改则县| 霍山县| 宾川县| 岳普湖县| 望奎县| 阿尔山市| 陆良县|