国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

15行Python代碼實現網易云熱門歌單實例教程

2020-01-04 13:36:02
字體:
來源:轉載
供稿:網友

0. 引言

馬上314情人節就要來了,是否需要一首歌來撫慰你,受傷或躁動的心靈。來吧,今天教你用15行代碼搞定熱門歌單。學起來并聽起來吧。

本文使用的是Selenium模塊,它是一個自動化測試工具,利用它我們可以驅動瀏覽器執行特定的動作,如點擊、下拉等等操作,對于一些 JavaScript 渲染的頁面來說,此種抓取方式非常有效。另外采用了Chrome瀏覽器配合Selenium工作。

下面話不多說了,來一起看看詳細的介紹吧

1. 環境

操作系統:Windows

Python版本:3.7.2

2. 準備工作

a. 若你的環境中沒有selenium模塊,直接使用pip安裝即可。

pip install selenium

b. 打開谷歌瀏覽器,檢查Chrome的版本:在瀏覽器地址中輸入 chrome://settings/help 回車即可看到。

Python代碼,網易云,歌單

c. 打開ChromeDriver 的官方網站:
https://sites.google.com/a/ch... 
尋找與你當前瀏覽器版本相對應的ChromeDriver下載。

Python代碼,網易云,歌單

d. 選擇你自己的操作系統類型進行下載即可。

Python代碼,網易云,歌單

e. 以Windows為例,下載結束后,將ChromeDriver 放置在python安裝目錄下的Scripts文件夾即可。

Python代碼,網易云,歌單

準備工作完成,代碼寫起來吧~

3. 迷你爬蟲的實現

我們這次的目標是爬取熱門歌單,比如網易云音樂中播放量大于1000萬的歌單信息(歌單名稱、鏈接)。

a. 我們先來打開網易云的歌單第一頁:
https://music.163.com/#/disco...

b. 使用Chrome的開發者工具<F12>進行分析。

Python代碼,網易云,歌單

我們想要拿的信息全在這里:

  • msk,封面[mask]:有歌單的名稱及鏈接
  • nb,播放數[number broadcast]:135萬

c. 我們還需要遍歷所有的頁,使用工具繼續分析,找到“下一頁”的URL。

Python代碼,網易云,歌單

d. 切換至最后一頁,拿到最后一頁的URL。

Python代碼,網易云,歌單

e. 等我們爬取完所有符合的歌單信息后,將其保存在本地。

f. 全部工作結束,最后再通過下面的偽代碼回顧下整體思路。

Python代碼,網易云,歌單

g. 爬取的效果如下:

Python代碼,網易云,歌單

4. 總結

本文旨在安撫你因情人節受傷的小心靈,同時帶你入個爬蟲的門,感受下python的強大。

好了,以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對VEVB武林網的支持。


注:相關教程知識閱讀請移步到python教程頻道。
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 兴业县| 太康县| 福海县| 施甸县| 丰原市| 北宁市| 离岛区| 保亭| 仙桃市| 娱乐| 汽车| 犍为县| 镇巴县| 广宗县| 房山区| 靖江市| 鸡泽县| 海阳市| 辛集市| 淮阳县| 凤冈县| 镇江市| 广饶县| 深水埗区| 新巴尔虎右旗| 宜川县| 内丘县| 高碑店市| 任丘市| 察隅县| 马边| 株洲县| 濮阳县| 如皋市| 邯郸县| 大姚县| 屏东县| 兰西县| 阳东县| 阳东县| 灵宝市|