国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python之Scrapy爬蟲框架安裝及簡單使用詳解

2020-02-16 11:16:23
字體:
來源:轉載
供稿:網友

題記:早已聽聞python爬蟲框架的大名。近些天學習了下其中的Scrapy爬蟲框架,將自己理解的跟大家分享。有表述不當之處,望大神們斧正。

一、初窺Scrapy

Scrapy是一個為了爬取網站數據,提取結構性數據而編寫的應用框架。 可以應用在包括數據挖掘,信息處理或存儲歷史數據等一系列的程序中。

其最初是為了頁面抓取(更確切來說,網絡抓取)所設計的, 也可以應用在獲取API所返回的數據(例如Amazon Associates Web Services) 或者通用的網絡爬蟲。

本文檔將通過介紹Scrapy背后的概念使您對其工作原理有所了解, 并確定Scrapy是否是您所需要的。

當您準備好開始您的項目后,您可以參考入門教程。

二、Scrapy安裝介紹

Scrapy框架運行平臺及相關輔助工具

    Python2.7(Python最新版3.5,這里選擇了2.7版本) Python Package:pipandsetuptools. 現在pip依賴setuptools,如果未安裝,則會自動安裝setuptools。 lxml. 大多數Linux發行版自帶了lxml。如果缺失,請查看http://lxml.de/installation.html OpenSSL. 除了Windows(請查看平臺安裝指南)之外的系統都已經提供。

您可以使用pip來安裝Scrapy(推薦使用pip來安裝Python package).

pip install Scrapy

Windows下安裝流程:

1、安裝Python 2.7之后,您需要修改PATH環境變量,將Python的可執行程序及額外的腳本添加到系統路徑中。將以下路徑添加到PATH中:

C:/Python27/;C:/Python27/Scripts/;

除此之外,還可以用cmd命令來設置Path:

c:/python27/python.exe c:/python27/tools/scripts/win_add2path.py

安裝配置完成之后,可以執行命令python --version查看安裝的python版本。(如圖所示)

2、從http://sourceforge.net/projects/pywin32/安裝pywin32

請確認下載符合您系統的版本(win32或者amd64)

從https://pip.pypa.io/en/latest/installing.html安裝pip

3、打開命令行窗口,確認pip被正確安裝:

pip --version

4、到目前為止Python 2.7 及pip已經可以正確運行了。接下來安裝Scrapy:

pip install Scrapy

至此windows下Scrapy安裝已經結束。

三、Scrapy入門教程

1、在cmd中創建Scrapy項目工程。

scrapy startproject tutorial

H:/python/scrapyDemo>scrapy startproject tutorialNew Scrapy project 'tutorial', using template directory 'f://python27//lib//site-packages//scrapy//templates//project', created in:  H:/python/scrapyDemo/tutorialYou can start your first spider with:  cd tutorial  scrapy genspider example example.com

2、文件目錄結構如下:

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 社旗县| 芦山县| 香格里拉县| 临清市| 南安市| 无棣县| 花莲县| 土默特右旗| 偃师市| 娱乐| 安陆市| 沈阳市| 普兰县| 满城县| 寻乌县| 鄂托克旗| 长海县| 阿克| 库车县| 西贡区| 贡山| 榆中县| 醴陵市| 鄂托克旗| 泸水县| 博客| 长治县| 雅江县| 嘉义市| 松阳县| 洪江市| 桓仁| 舟山市| 茌平县| 枣庄市| 浦县| 西乌珠穆沁旗| 静乐县| 桃源县| 金阳县| 迭部县|