国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

python爬圖

2019-11-14 17:04:44
字體:
來源:轉載
供稿:網友

閑的無事,看著知乎里種種python優點,按捺不住,裝起python3.4。

網上找了點爬行圖片的代碼,修改至兼容3.4,成功爬行指定url所有jpg圖片,代碼段如下:

import osimport urllibimport urllib.requestimport re#爬行圖片download_path = os.path.dirname(os.path.abspath(__file__))class spider(object):    def __init__(self, url):        self.url = url    def parse(self,content):        pattern = 'src="(http://.*/.jpg)/s*"'        matchs = re.findall(pattern,content,re.M)        return matchs        def downloads(self,urls):        d_path = download_path + "/test"        if not os.path.exists(d_path):            os.mkdir(d_path)        for url in urls:            filename = url.split("/")[-1]            PRint (url)            print ("Downloads %s" % (filename))            output = "%s/%s" % (d_path, filename)            urllib.request.urlretrieve(url,output)               def run(self):        d_url = self.url        fd = urllib.request.urlopen(d_url)        try:            content = fd.read()            content = content.decode("UTF-8")            urls = self.parse(content)            self.downloads(urls)        finally:            fd.close()if __name__ == "__main__":    sp = spider("http://news.cnfol.com/img/20150814/17638.shtml")    sp.run()

 


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 睢宁县| 龙门县| 靖江市| 武川县| 玉门市| 九台市| 镇沅| 清镇市| 固安县| 新宾| 玉田县| 望奎县| 朝阳区| 台北市| 西乌| 洛扎县| 商城县| 淮安市| 普洱| 兴仁县| 香港 | 凤凰县| 利辛县| 清徐县| 岳阳市| 麻栗坡县| 宁国市| 衡阳县| 宁武县| 聊城市| 东至县| 辽宁省| 定襄县| 昌黎县| 徐闻县| 刚察县| 台州市| 道孚县| 呼伦贝尔市| 泰和县| 惠东县|