国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python抓取豆瓣圖片并自動保存示例學(xué)習(xí)

2020-02-23 05:03:22
字體:
供稿:網(wǎng)友

環(huán)境Python 2.7.6,BS4,在powershell或命令行均可運行。請確保安裝了BS模塊

代碼如下:
# -*- coding:utf8 -*-
# 2013.12.36 19:41 wnlo-c209
# 抓取dbmei.com的圖片。

from bs4 import BeautifulSoup
import os, sys, urllib2

# 創(chuàng)建文件夾,昨天剛學(xué)會
path = os.getcwd()          # 獲取此腳本所在目錄
new_path = os.path.join(path,u'豆瓣妹子')
if not os.path.isdir(new_path):
 os.mkdir(new_path)


def page_loop(page=0):
 url = 'http://www.dbmeizi.com/?p=%s' % page
 content = urllib2.urlopen(url)

 soup = BeautifulSoup(content)

 my_girl = soup.find_all('img')  

    # 加入結(jié)束檢測,寫的不好....
 if my_girl ==[]:
  print u'已經(jīng)全部抓取完畢'
  sys.exit(0)

 print u'開始抓取'
 for girl in my_girl:
  link = girl.get('src')
  flink = 'http://www.dbmeizi.com/' + link

  print flink
  content2 = urllib2.urlopen(flink).read()
  with open(u'豆瓣妹子'+'/'+flink[-11:],'wb') as code:   #在OSC上現(xiàn)學(xué)的
   code.write(content2)
 page = int(page) + 1
 print u'開始抓取下一頁'
 print 'the %s page' % page
 page_loop(page)

page_loop().

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 焦作市| 胶南市| 肇源县| 南充市| 威信县| 武城县| 安康市| 阿拉善右旗| 札达县| 临洮县| 冕宁县| 休宁县| 黄陵县| 高陵县| 攀枝花市| 岱山县| 民和| 阜新市| 张家口市| 乌鲁木齐县| 云霄县| 霍城县| 时尚| 昭苏县| 泾川县| 龙井市| 崇信县| 高雄市| 兴化市| 繁昌县| 迭部县| 肇州县| 什邡市| 平泉县| 保德县| 平顺县| 府谷县| 玉环县| 西乌珠穆沁旗| 大同市| 谢通门县|