国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法

2020-02-23 00:36:11
字體:
供稿:網(wǎng)友

本文實(shí)例講述了Python打印scrapy蜘蛛抓取樹結(jié)構(gòu)的方法。分享給大家供大家參考。具體如下:

通過下面這段代碼可以一目了然的知道scrapy的抓取頁面結(jié)構(gòu),調(diào)用也非常簡(jiǎn)單

#!/usr/bin/env pythonimport fileinput, refrom collections import defaultdictdef print_urls(allurls, referer, indent=0):  urls = allurls[referer]  for url in urls:    print ' '*indent + referer    if url in allurls:      print_urls(allurls, url, indent+2)def main():  log_re = re.compile(r'<GET (.*?)> /(referer: (.*?)/)')  allurls = defaultdict(list)  for l in fileinput.input():    m = log_re.search(l)    if m:      url, ref = m.groups()      allurls[ref] += [url]  print_urls(allurls, 'None')main()

希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 河津市| 双鸭山市| 临湘市| 理塘县| 石棉县| 电白县| 玉屏| 宜丰县| 广汉市| 台南市| 泰来县| 黄山市| 团风县| 中方县| 涪陵区| 娄底市| 福州市| 涞水县| 宁国市| 育儿| 子长县| 拉孜县| 双流县| 富阳市| 平谷区| 岚皋县| 余江县| 攀枝花市| 仙游县| 福州市| 长兴县| 岑溪市| 渭源县| 黔南| 安顺市| 开平市| 临澧县| 兴和县| 澄江县| 万宁市| 石狮市|