国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python使用scrapy采集數據時為每個請求隨機分配user-agent的方法

2019-11-25 17:48:34
字體:
來源:轉載
供稿:網友

本文實例講述了Python使用scrapy采集數據時為每個請求隨機分配user-agent的方法。分享給大家供大家參考。具體分析如下:

通過這個方法可以每次請求更換不同的user-agent,防止網站根據user-agent屏蔽scrapy的蜘蛛

首先將下面的代碼添加到settings.py文件,替換默認的user-agent處理模塊

復制代碼 代碼如下:
DOWNLOADER_MIDDLEWARES = {
    'scraper.random_user_agent.RandomUserAgentMiddleware': 400,
      'scrapy.contrib.downloadermiddleware.useragent.UserAgentMiddleware': None,
}

自定義useragent處理模塊
復制代碼 代碼如下:
from scraper.settings import USER_AGENT_LIST
import random
from scrapy import log
class RandomUserAgentMiddleware(object):
    def process_request(self, request, spider):
        ua  = random.choice(USER_AGENT_LIST)
        if ua:
            request.headers.setdefault('User-Agent', ua)
        #log.msg('>>>> UA %s'%request.headers)

希望本文所述對大家的Python程序設計有所幫助。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 定襄县| 安徽省| 建阳市| 兰考县| 明溪县| 云浮市| 博野县| 台南市| 汪清县| 高淳县| 九江县| 仪征市| 呼伦贝尔市| 阳东县| 噶尔县| 新闻| 延吉市| 林甸县| 南宁市| 康马县| 唐山市| 罗源县| 广州市| 长岭县| 枣强县| 法库县| 白山市| 隆昌县| 广东省| 滦平县| 潮州市| 临猗县| 南木林县| 大竹县| 乳源| 诸暨市| 准格尔旗| 南丰县| 芜湖县| 交口县| 科尔|