国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<span id="jnfy1"></span>

<small id="jnfy1"><dl id="jnfy1"></dl></small>

<track id="jnfy1"><tbody id="jnfy1"><noframes id="jnfy1"></noframes></tbody></track>

<p id="jnfy1"><ins id="jnfy1"><th id="jnfy1"></th></ins></p>

首頁 > 編程 > Python > 正文

Python使用scrapy采集數據過程中放回下載過大頁面的方法

2019-11-25 17:48:42

字體：大中小

來源：轉載

供稿：網友

本文實例講述了Python使用scrapy采集數據過程中放回下載過大頁面的方法。分享給大家供大家參考。具體分析如下：

添加以下代碼到settings.py，myproject為你的項目名稱

復制代碼代碼如下:

DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory'

自定義限制下載過大頁面的模塊

復制代碼代碼如下:

MAX_RESPONSE_SIZE = 1048576 # 1Mb
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class LimitSizePageGetter(ScrapyHTTPPageGetter):
    def handleHeader(self, key, value):
        ScrapyHTTPPageGetter.handleHeader(self, key, value)
        if key.lower() == 'content-length' and int(value) > MAX_RESPONSE_SIZE:
            self.connectionLost('oversized')
class LimitSizeHTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = LimitSizePageGetter

希望本文所述對大家的Python程序設計有所幫助。

上一篇：Python bsddb模塊操作Berkeley DB數據庫介紹

下一篇：在Python中使用M2Crypto模塊實現AES加密的教程

學習交流

索泰發布一款GTX 1070 Mini迷你版本:小機

索泰發布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

榮耀總裁趙明烏鎮演講：榮耀首款5G手機V30下月發布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術創造現實價值

2019-10-21 09:00:12

滴滴英文服務上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：江口县| 台安县| 枞阳县| 京山县| 临朐县| 札达县| 泰来县| 麻阳| 嘉善县| 芦溪县| 东海县| 河北省| 麦盖提县| 景洪市| 东兴市| 淄博市| 那坡县| 巴里| 密山市| 平果县| 华亭县| 蒙城县| 金堂县| 大田县| 德庆县| 皮山县| 新和县| 丘北县| 元阳县| 临高县| 商水县| 南城县| 双鸭山市| 营口市| 大足县| 清新县| 和硕县| 尚义县| 永城市| 青海省| 宜良县|

<td id="lhnby"></td>

<sub id="lhnby"></sub>