国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<td id="sxvka"><tr id="sxvka"></tr></td>

<style id="sxvka"><tbody id="sxvka"><dfn id="sxvka"></dfn></tbody></style>

首頁 > 編程 > Python > 正文

Python使用scrapy采集數據過程中放回下載過大頁面的方法

2020-02-23 00:36:43

字體：大中小

來源：轉載

供稿：網友

本文實例講述了Python使用scrapy采集數據過程中放回下載過大頁面的方法。分享給大家供大家參考。具體分析如下：

添加以下代碼到settings.py，myproject為你的項目名稱
代碼如下:DOWNLOADER_HTTPCLIENTFACTORY = 'myproject.downloader.LimitSizeHTTPClientFactory'

自定義限制下載過大頁面的模塊
代碼如下:MAX_RESPONSE_SIZE = 1048576 # 1Mb
from scrapy.core.downloader.webclient import ScrapyHTTPClientFactory, ScrapyHTTPPageGetter
class LimitSizePageGetter(ScrapyHTTPPageGetter):
    def handleHeader(self, key, value):
        ScrapyHTTPPageGetter.handleHeader(self, key, value)
        if key.lower() == 'content-length' and int(value) > MAX_RESPONSE_SIZE:
            self.connectionLost('oversized')
class LimitSizeHTTPClientFactory(ScrapyHTTPClientFactory):
     protocol = LimitSizePageGetter

希望本文所述對大家的Python程序設計有所幫助。

上一篇：python自然語言編碼轉換模塊codecs介紹

下一篇：Python中用format函數格式化字符串的用法

學習交流

筆記本開機提示error loading os錯誤的問

筆記本開機提示error loading os錯誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

雷軍：小米成立10年收入突破2000億

2020-02-23 14:27:16

特斯拉：無鈷，不代表一定是磷酸鐵鋰電池

2020-02-22 09:45:28

豌豆莢宣布業務調整將于2月28日關閉PC版在線服務

2020-02-22 09:42:20

小米集團宣布人事任命：聯合創始人王川擔任小米集團首席戰略官

2020-02-22 09:39:07

外媒：高通康寧合作開發毫米波5G室內解決方案

2020-02-21 16:46:56

華為終端產品與戰略線上發布會：5G全場景，共聯未來

2020-02-20 10:01:00

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：安塞县| 东莞市| 邵东县| 临泉县| 柳林县| 南乐县| 阳谷县| 睢宁县| 鱼台县| 海阳市| 松原市| 云林县| 梁平县| 金门县| 昭苏县| 阿拉善左旗| 筠连县| 桐乡市| 昌都县| 双城市| 商城县| 内黄县| 广水市| 吉安县| 伊川县| 休宁县| 阿城市| 苏尼特右旗| 彰武县| 奈曼旗| 临沂市| 凤凰县| 勐海县| 宝应县| 汽车| 烟台市| 奉新县| 忻州市| 扎鲁特旗| 东阿县| 乌拉特后旗|

<td id="24k89"></td>

^{<noscript id="24k89"></noscript>}

<small id="24k89"></small>