Python提取網(wǎng)頁中超鏈接的方法

2019-11-25 16:33:36

字體：大中小

供稿：網(wǎng)友

下面是最簡單的實(shí)現(xiàn)方法，先將目標(biāo)網(wǎng)頁抓回來，然后通過正則匹配a標(biāo)簽中的href屬性來獲得超鏈接

代碼如下：

import urllib2import re url = 'http://www.sunbloger.com/' req = urllib2.Request(url)con = urllib2.urlopen(req)doc = con.read()con.close() links = re.findall(r'href/=/"(http/:////[a-zA-Z0-9/.//]+)/"', doc)for a in links:  print a

總結(jié)

以上就是這篇文章的全部內(nèi)容，希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能有所幫助，如果有疑問大家可以留言交流。

上一篇：Python中l(wèi)ist初始化方法示例

下一篇：python解決Fedora解壓zip時(shí)中文亂碼的方法

學(xué)習(xí)交流

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)

索泰發(fā)布一款GTX 1070 Mini迷你版本:小機(jī)箱大愛...

熱門圖片

猜你喜歡的新聞

猜你喜歡的關(guān)注

新聞熱點(diǎn)

榮耀總裁趙明烏鎮(zhèn)演講：榮耀首款5G手機(jī)V30下月發(fā)布

2019-10-23 09:17:05

搜狐張朝陽：回歸媒體是搜狐重新崛起的關(guān)鍵

2019-10-21 09:20:02

華為輪值董事長郭平：虛擬技術(shù)創(chuàng)造現(xiàn)實(shí)價(jià)值

2019-10-21 09:00:12

滴滴英文服務(wù)上線兩周年用戶已超200萬

2019-09-26 08:57:12

華為推出全球至快AI訓(xùn)練集群Atlas900

2019-09-25 08:46:36

馬斯克：特斯拉正組建中國技術(shù)團(tuán)隊(duì)

2019-09-25 08:15:43

疑難解答

圖片精選

網(wǎng)友關(guān)注

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

Python提取網(wǎng)頁中超鏈接的方法