国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

Python爬取百度貼吧圖片腳本

2019-11-08 02:03:37
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

新手,以下是爬取百度貼吧制定帖子的圖片腳本,因?yàn)槟_本主要是解析html代碼,因此一旦百度修改頁(yè)面前端代碼,那么腳本會(huì)失效,權(quán)當(dāng)爬蟲(chóng)入門(mén)練習(xí)吧,后續(xù)還會(huì)嘗試更多的爬蟲(chóng)。

# coding=utf-8# !/usr/bin/env pythonimport urllib, string, osfrom bs4 import BeautifulSoupdef getHtml(url):    page = urllib.urlopen(url)    html = page.read()    return htmldef getImg():    imgPath = 'F:/craw_tieba/'    if not os.path.exists(imgPath):        os.makedirs(imgPath)    baseUrl = 'http://tieba.baidu.com/p/4657665666'    imgList = []    for pg in range(1, 114):        url = baseUrl + '?pn=' + str(pg)        
發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 定结县| 庄浪县| 康马县| 沧州市| 蓬莱市| 陈巴尔虎旗| 阳城县| 成武县| 永福县| 古蔺县| 四川省| 合川市| 新乡市| 甘南县| 连南| 错那县| 盘锦市| 江北区| 绥化市| 美姑县| 吴桥县| 保德县| 故城县| 德兴市| 金沙县| 江源县| 长丰县| 平果县| 察隅县| 怀集县| 沾化县| 梅河口市| 牡丹江市| 文成县| 寻甸| 宁远县| 紫阳县| 定兴县| 三河市| 巧家县| 台东市|