国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

<small id="kvymq"><tbody id="kvymq"><noframes id="kvymq"></noframes></tbody></small>

<small id="kvymq"><tbody id="kvymq"></tbody></small>

<noscript id="kvymq"><tbody id="kvymq"></tbody></noscript>

<td id="kvymq"></td>

首頁 > 編程 > Python > 正文

Python使用scrapy抓取網(wǎng)站sitemap信息的方法

2020-02-23 00:36:57

字體：大中小

來源：轉(zhuǎn)載

供稿：網(wǎng)友

本文實例講述了Python使用scrapy抓取網(wǎng)站sitemap信息的方法。分享給大家供大家參考。具體如下：

import refrom scrapy.spider import BaseSpiderfrom scrapy import logfrom scrapy.utils.response import body_or_strfrom scrapy.http import Requestfrom scrapy.selector import HtmlXPathSelectorclass SitemapSpider(BaseSpider): name = "SitemapSpider" start_urls = ["http://www.domain.com/sitemap.xml"] def parse(self, response):  nodename = 'loc'  text = body_or_str(response)  r = re.compile(r"(<%s[/s>])(.*?)(</%s>)"%(nodename,nodename),re.DOTALL)  for match in r.finditer(text):   url = match.group(2)   yield Request(url, callback=self.parse_page) def parse_page(self, response):    hxs = HtmlXPathSelector(response)    #Mock Item  blah = Item()  #Do all your page parsing and selecting the elemtents you want    blash.divText = hxs.select('//div/text()').extract()[0]  yield blah

希望本文所述對大家的Python程序設(shè)計有所幫助。

上一篇：介紹Python中幾個常用的類方法

下一篇：Python bsddb模塊操作Berkeley DB數(shù)據(jù)庫介紹

學(xué)習(xí)交流

筆記本開機提示error loading os錯誤的問

筆記本開機提示error loading os錯誤的問題怎么解決...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點

雷軍：小米成立10年收入突破2000億

2020-02-23 14:27:16

特斯拉：無鈷，不代表一定是磷酸鐵鋰電池

2020-02-22 09:45:28

豌豆莢宣布業(yè)務(wù)調(diào)整將于2月28日關(guān)閉PC版在線服務(wù)

2020-02-22 09:42:20

小米集團(tuán)宣布人事任命：聯(lián)合創(chuàng)始人王川擔(dān)任小米集團(tuán)首席戰(zhàn)略官

2020-02-22 09:39:07

外媒：高通康寧合作開發(fā)毫米波5G室內(nèi)解決方案

2020-02-21 16:46:56

華為終端產(chǎn)品與戰(zhàn)略線上發(fā)布會：5G全場景，共聯(lián)未來

2020-02-20 10:01:00

疑難解答

圖片精選

網(wǎng)友關(guān)注

主站蜘蛛池模板：连江县| 诸城市| 商丘市| 望谟县| 兴化市| 丽江市| 墨脱县| 友谊县| 康定县| 汉川市| 吉安市| 大丰市| 卓资县| 霍林郭勒市| 贺兰县| 塘沽区| 兴义市| 东阳市| 金昌市| 荣成市| 庄浪县| 舞钢市| 盖州市| 紫金县| 临漳县| 木兰县| 临湘市| 巴中市| 云阳县| 阿瓦提县| 黄山市| 安新县| 札达县| 酒泉市| 万载县| 浦北县| 介休市| 兴仁县| 溆浦县| 屯昌县| 修武县|

<small id="rji6y"><tbody id="rji6y"></tbody></small><small id="rji6y"><tbody id="rji6y"></tbody></small>

<small id="rji6y"><tbody id="rji6y"></tbody></small>

<noscript id="rji6y"></noscript>