国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

【爬蟲一】urllib庫使用

2019-11-14 11:32:04
字體:
來源:轉載
供稿:網友


本篇為基礎爬蟲的模板,使用urllib庫。 代碼功能:爬取百度貼吧的圖片。 代碼如下:

import reimport urllibdef getHtml(url): page=urllib.urlopen(url) html=page.read() return htmldef getImg(html): reg=r'src="(.+?/.jpg)" size=' imgre=re.compile(reg) imglist=re.findall(imgre,html) x=0 for imgurl in imglist: urllib.urlretrieve(imgurl,'%s.jpg'%x) #urllib.urlretrieve()方法,直接將遠程數據下載到本地。 x+=1name='http://tieba.baidu.com/p/4859088308'html=getHtml(name)getImg(html)注釋:

1、re是正則庫,詳細可看 http://m.survivalescaperooms.com/fnng/archive/2013/05/20/3089816.html




發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 蓬莱市| 永嘉县| 陆河县| 马公市| 苏尼特左旗| 板桥市| 冕宁县| 枣庄市| 赤水市| 万源市| 洛川县| 浦东新区| 福安市| 科技| 武陟县| 涡阳县| 陵水| 张家港市| 林西县| 鄂托克前旗| 喀喇沁旗| 佳木斯市| 太保市| 通渭县| 垦利县| 罗山县| 东山县| 图们市| 鄂州市| 安吉县| 阿勒泰市| 册亨县| 永定县| 香河县| 凉山| 抚松县| 安岳县| 泸西县| 麟游县| 汾阳市| 临西县|