国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python爬蟲:通過關鍵字爬取百度圖片

2019-11-25 16:21:04
字體:
來源:轉載
供稿:網友

使用工具:Python2.7 點我下載

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安裝python2.7 ---然后在cmd當中輸入python,界面如下則安裝成功

 2.集成Scrapy框架----輸入命令行:pip install Scrapy

安裝成功界面如下:

失敗的情況很多,舉例一種:

解決方案:

其余錯誤可百度搜索。

二。開始編程。

1.爬取無反爬蟲措施的靜態網站。例如百度貼吧,豆瓣讀書。

例如-《桌面吧》的一個帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代碼如下:

代碼注釋:引入了兩個模塊urllib,re。定義兩個函數,第一個函數是獲取整個目標網頁數據,第二個函數是在目標網頁中獲取目標圖片,遍歷網頁,并且給獲取的圖片按照0開始排序。

注:re模塊知識點:

爬取圖片效果圖:

圖片保存路徑默認在建立的.py同目錄文件下。

2.爬取有反爬蟲措施的百度圖片。如百度圖片等。

例如關鍵字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

圖片采用滾動式加載,先爬取最優先的30張。

代碼如下:

代碼注釋:導入4個模塊,os模塊用于指定保存路徑。前兩個函數同上。第三個函數使用了if語句,并tryException異常。

爬取過程如下:

爬取結果:

注:編寫python代碼注重對齊,and不能混用Tab和空格,易報錯。

以上就是本文的全部內容,希望本文的內容對大家的學習或者工作能帶來一定的幫助,同時也希望多多支持武林網!

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 定日县| 陈巴尔虎旗| 长泰县| 满洲里市| 登封市| 嘉黎县| 建昌县| 马关县| 黑山县| 徐闻县| 乌什县| 峨山| 邻水| 龙门县| 巴塘县| 堆龙德庆县| 兴业县| 淮南市| 紫阳县| 广元市| 吉林市| 改则县| 中西区| 五常市| 文登市| 古浪县| 镇雄县| 泰兴市| 泌阳县| 建昌县| 定州市| 广宗县| 青铜峡市| 临泽县| 阿坝县| 呼和浩特市| 临桂县| 富川| 崇文区| 定远县| 亳州市|