国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<source id="oygqa"></source>

首頁 > 編程 > Python > 正文

Python打印scrapy蜘蛛抓取樹結構的方法

2019-11-25 17:48:45

字體：大中小

來源：轉載

供稿：網友

本文實例講述了Python打印scrapy蜘蛛抓取樹結構的方法。分享給大家供大家參考。具體如下：

通過下面這段代碼可以一目了然的知道scrapy的抓取頁面結構，調用也非常簡單

#!/usr/bin/env pythonimport fileinput, refrom collections import defaultdictdef print_urls(allurls, referer, indent=0):  urls = allurls[referer]  for url in urls:    print ' '*indent + referer    if url in allurls:      print_urls(allurls, url, indent+2)def main():  log_re = re.compile(r'<GET (.*?)> /(referer: (.*?)/)')  allurls = defaultdict(list)  for l in fileinput.input():    m = log_re.search(l)    if m:      url, ref = m.groups()      allurls[ref] += [url]  print_urls(allurls, 'None')main()

希望本文所述對大家的Python程序設計有所幫助。

上一篇：Python使用scrapy采集時偽裝成HTTP/1.1的方法

下一篇：使用IPython來操作Docker容器的入門指引

學習交流

索泰發布一款GTX 1070 Mini迷你版本:小機

索泰發布一款GTX 1070 Mini迷你版本:小機箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關注

新聞熱點

榮耀總裁趙明烏鎮演講：榮耀首款5G手機V30下月發布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術創造現實價值

2019-10-21 09:00:12

滴滴英文服務上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術團隊

2019-09-25 08:15:43

疑難解答

圖片精選

網友關注

主站蜘蛛池模板：枣强县| 陈巴尔虎旗| 武城县| 普定县| 灵丘县| 白山市| 海丰县| 洛阳市| 万年县| 宁化县| 海林市| 杭锦后旗| 鄂托克前旗| 和顺县| 大荔县| 英山县| 当涂县| 红河县| 海伦市| 县级市| 青阳县| 瑞丽市| 井陉县| 靖宇县| 陵水| 张家口市| 长丰县| 英德市| 沂源县| 金川县| 华亭县| 年辖：市辖区| 大港区| 龙里县| 莱阳市| 沂南县| 阿坝县| 宜兴市| 鄂尔多斯市| 英山县| 尚义县|