国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python爬蟲獲取百度首頁內(nèi)容教學

2020-01-04 13:44:15
字體:
供稿:網(wǎng)友

由傳智播客教程整理,我們這里使用的是python2.7.x版本,就是2.7之后的版本,因為python3的改動略大,我們這里不用它。現(xiàn)在我們嘗試一下url和網(wǎng)絡(luò)爬蟲配合的關(guān)系,爬瀏覽器首頁信息。

1、首先我們創(chuàng)建一個urllib2_test01.py,然后輸入以下代碼:

python,爬蟲,百度

2、最簡單的獲取一個url的信息代碼居然只需要4行,執(zhí)行寫的python代碼:

python,爬蟲,百度

3、之后我們會看到一下的結(jié)果

python,爬蟲,百度

4、

 
實際上,如果我們在瀏覽器上打開網(wǎng)頁主頁的話,右鍵選擇“查看源代碼”,你會發(fā)現(xiàn),跟我們剛打印出來的是一模一樣的。也就是說,上面的4行代碼就已經(jīng)幫我們把百度的首頁和全部代碼爬了下來了 。

 

 

 
5、下面我們介紹一下這四行代碼,第一行如下圖,這個就是將urllib2組件進入進來,供給我們使用。

 

python,爬蟲,百度

6、圖片下面這步驟是調(diào)用urllib2庫中的urlopen方法,該方法接受一個url地址,然后將請求后的得到的回應封裝到一個叫respones對象當中。

python,爬蟲,百度

7、最后這里,是調(diào)用response對象的read()方法,將請求的回應內(nèi)容以字符串的形式給html變量。最后的print html就是將字符串打出來,所以說一個基本的url請求是對應的python代碼是很簡單的。

python,爬蟲,百度

總結(jié):以上就是關(guān)于利用python爬蟲獲取百度信息的步驟內(nèi)容,感謝大家的學習和對VEVB武林網(wǎng)的支持。


注:相關(guān)教程知識閱讀請移步到python教程頻道。
發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 和政县| 汉川市| 会泽县| 伊春市| 新疆| 阳新县| 宜兰县| 得荣县| 叶城县| 乳山市| 湘潭县| 哈密市| 双柏县| 兴仁县| 集安市| 保山市| 儋州市| 静宁县| 新建县| 集安市| 鲁山县| 堆龙德庆县| 红原县| 融水| 黑龙江省| 达尔| 东台市| 勃利县| 迁西县| 昌吉市| 武城县| 台中市| 泰安市| 房山区| 康保县| 汨罗市| 资溪县| 溧水县| 樟树市| 全南县| 临朐县|