下面是最簡單的實(shí)現(xiàn)方法,先將目標(biāo)網(wǎng)頁抓回來,然后通過正則匹配a標(biāo)簽中的href屬性來獲得超鏈接
代碼如下:
import urllib2import re url = 'http://www.sunbloger.com/' req = urllib2.Request(url)con = urllib2.urlopen(req)doc = con.read()con.close() links = re.findall(r'href/=/"(http/:////[a-zA-Z0-9/.//]+)/"', doc)for a in links: print a
總結(jié)
以上就是這篇文章的全部內(nèi)容,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作能有所幫助,如果有疑問大家可以留言交流。
新聞熱點(diǎn)
疑難解答
圖片精選