国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲框架Scrapy常用命令總結

2020-01-04 14:46:56
字體:
來源:轉載
供稿:網友

本文實例講述了Python爬蟲框架Scrapy常用命令。分享給大家供大家參考,具體如下:

在Scrapy中,工具命令分為兩種,一種為全局命令,一種為項目命令

全局命令不需要依靠Scrapy項目就可以在全局中直接運行,而項目命令必須要在Scrapy項目中才可以運行

全局命令

全局命令有哪些呢,要想了解在Scrapy中有哪些全局命令,可以在不進入Scrapy項目所在目錄的情況下,運行scrapy-h,如圖所示:

Python,爬蟲,Scrapy

可以看到,此時在可用命令在終端下展示出了常見的全局命令,分別為fetchrunspidersettingsshellstartprojectversionview

fetch命令

fetch命令主要用來顯示爬蟲爬取的過程.如下圖所示:

Python,爬蟲,Scrapy

在使用fetch命令時,同樣可以使用某些參數進行相應的控制。那么fetch有哪些相關參數可以使用呢?我們可以通過scrpy fetch -h列出所有可以使用的fetch相關參數。比如我們可以使用–headers顯示頭信息,也可以使用–nolog控制不顯示日志信息,還可以使用–spider=SPIDER參數來控制使用哪個爬蟲,通過–logfile=FILE指定存儲日志信息的文件,通過–loglevel=LEVEL控制日志等級。舉個栗子:

# 顯示頭信息,并且不顯示日志信息scrpay -fetch --headers --nolog http://www.baidu.com

sunspider命令

通過runspider命令可以不依托scrapy的爬蟲項目,直接運行一個爬蟲文件

# first.py為自定義的一個爬蟲文件scrapy runspider first.py

settings命令

在scrapy項目所在的目錄中使用settings命令查看的使用對應的項目配置信息,如果在scrapy項目所在的目錄外使用settings命令查看的Scrapy默認的配置信息

# 在項目中使用此命令打印的為BOT_NAME對應的值,即scrapy項目名稱。# 在項目外使用此命令打印的為scrapybotscrapy settings --get BOT_NAME

shell命令

通過shell命令可以啟動Scrapy的交互終端。

Scrapy的交互終端經常在開發以及調試的時候用到,使用Scrapy的交互終端可以實現在不啟動Scrapy爬蟲的情況下,對網站響應進行調試,同樣,在該交互終端下,我們也可以寫一些Python代碼進行相應測試。

Python,爬蟲,Scrapy

>>>后面可以輸入交互命令以及相應的代碼

startproject命令

用于創建scrapy項目

version命令

查看scrapy版本

view命令

用于下載某個網頁,然后通過瀏覽器查看

項目命令

bench命令

測試本地硬件的性能

scrapy bench

genspider命令

用于創建爬蟲文件,這是一種快速創建爬蟲文件的方式。

# scrpay genspider -t 基本格式# basic 模板# baidu.com 爬取的域名scrapy genspider -t basic xxx baidu.com

此時在spider文件夾下會生成一個以xxx命名的py文件。可以使用scrapy genspider -l查看所有可用爬蟲模板。當前可用的爬蟲模板有:basiccrawlcsvfeedxmlfeed

check命令

使用check命令可以實現對某個爬蟲文件進行合同檢查,即測試.

# xxx為爬蟲名scrapy check xxx

crawl命令

啟動某個爬蟲

# xxx為爬蟲名scrapy crawl xxx

list命令

列出當前可使用的爬蟲文件

scrapy list

edit命令

編輯爬蟲文件

scrapy edit xxx

parse命令

通過parse命令,我們可以實現獲取指定的URL網址,并使用對應的爬蟲文件進行處理和分析

日志等級

 

等級名 含義
CRITICAL 發生了最嚴重的錯誤
ERROR 發生了必須立即處理的錯誤
WARNING 出現了一些警告信息,即存在潛在錯誤
INFO 輸出一些提示顯示
DEBUG 輸出一些調試信息


希望本文所述對大家Python程序設計有所幫助。


注:相關教程知識閱讀請移步到python教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 石嘴山市| 冀州市| 连山| 天水市| 南澳县| 运城市| 张家港市| 扶风县| 东乌| 杭州市| 青冈县| 特克斯县| 房产| 文登市| 晋江市| 兴文县| 崇明县| 雅安市| 南郑县| 林口县| 镇巴县| 潼南县| 临潭县| 沙河市| 龙江县| 哈尔滨市| 滁州市| 高唐县| 乐昌市| 金门县| 大同县| 交口县| 沅江市| 新乡县| 长乐市| 龙州县| 四平市| 襄樊市| 二连浩特市| 乌鲁木齐县| 天门市|