国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python urllib爬取百度云連接的實例代碼

2020-02-16 01:43:10
字體:
來源:轉載
供稿:網友

翻看自己以前寫的程序,發現寫過一個爬取盤多多百度云資源的東西,完全是當時想看變形金剛才自己寫的,而且當時第一次接觸python大概寫了有2天才搞出來這個程序,學習python語言,可以看得出來那時候的代碼寫的真的low。雖然現在也不怎么樣,哈哈,一直學習中,不做過多解釋,上圖上代碼,因為變量的聲明是什么我自己也忘了(手動傲嬌),連寫入文件當時都不會哈哈哈哈哈哈哈哈,也不知道class中可以通過init初始化,唉學習python原來我學到了這么多東西,感謝python

from bs4 import BeautifulSoupimport urllibimport requestsimport readr =[]''''對搜素資源名字進行url編碼'''search_text =raw_input('請輸入搜索資源名:')search_text = search_text.decode('gbk')search_text = search_text.encode('utf-8')search_text = urllib.quote(search_text)''''獲取文件地址'''home = urllib.urlopen('http://www.panduoduo.net/s/name/'+search_text)'''獲取百度云地址'''def getbaidu(adr):  for i in adr:    url = urllib.urlopen('http://www.panduoduo.net'+i)    bs = BeautifulSoup(url)    bs1 = bs.select('.dbutton2')    href = re.compile('http/%(/%|/d|/w|////|//|/.)*')    b = href.search(str(bs1))    name = str(bs.select('.center')).decode('utf-8')    text1 = re.compile('/<h1/sclass/=/"center"/>[/d|/w|/D|/W]*/</h1/>')    text2 = text1.search(name)    rag1 = re.compile('/>[/d|/w|/D|/W]*/<')    if text2:      text3 = rag1.search(text2.group())      if text3:        print text3.group()    if b:      text = urllib.unquote(str(b.group())).decode('utf-8')      print text'''初始化'''def init(adr):  soup = BeautifulSoup(home)  soup = soup.select('.row')  pattern = re.compile('//r///d+')  for i in soup:    i = str(i)    adress = pattern.search(i)    adress = adress.group()    adr.append(adress)print 'running---------'    init(adr)getbaidu(adr)

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林站長站。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 正安县| 镇沅| 上蔡县| 宝山区| 资兴市| 库尔勒市| 丹东市| 东方市| 象州县| 佛冈县| 永兴县| 调兵山市| 太湖县| 神木县| 衡东县| 丰县| 保德县| 遂溪县| 大安市| 文安县| 玉树县| 时尚| 象山县| 东光县| 津市市| 郸城县| 常山县| 天长市| 大洼县| 商河县| 广德县| 呼伦贝尔市| 辽宁省| 阿拉善盟| 大姚县| 河西区| 安阳市| 忻城县| 邓州市| 淮北市| 府谷县|