国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

python3簡(jiǎn)單爬蟲

2019-11-14 17:46:02
字體:
供稿:網(wǎng)友

最近在抽空學(xué)了一下python,于量就拿爬是練了下手,不得不說python的上手非常簡(jiǎn)單。在網(wǎng)上找了一下,大都是python2的帖子,于是隨手寫了個(gè)python3的。代碼非常簡(jiǎn)單就不解釋了,直接貼代碼。

#test rdpimport urllib.requestimport re
#登錄用的帳戶信息data={}data['fromUrl']=''data['fromUrlTemp']=''data['loginId']='12345'data['passWord']='12345'user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'#登錄地址 #url='http://192.168.1.111:8080/loginCheck'postdata = urllib.parse.urlencode(data) postdata = postdata.encode('utf-8')headers = { 'User-Agent' : user_agent } #登錄 res = urllib.request.urlopen(url,postdata)#取得頁(yè)面html
strResult=(res.read().decode('utf-8'))#用正則表達(dá)式取出所有A標(biāo)簽p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')for m in p.finditer(strResult): PRint (m.group(1))#group(1)是href里面的內(nèi)容,group(2)是a標(biāo)簽里的文字

 

關(guān)于cookie、異常等處理看了一下,沒有花時(shí)間去處理,畢竟只是想通過寫爬蟲來學(xué)習(xí)python。

想要深入的去看這個(gè)系列的文章,寫得非常詳細(xì)了。

[Python]網(wǎng)絡(luò)爬蟲

 下面是python語法教程,真的只要幾分鐘就能看完。

Python3 入門教程


上一篇:python類方法和靜態(tài)方法

下一篇:KM3

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 仙居县| 邵阳县| 商洛市| 西乌珠穆沁旗| 扶余县| 武川县| 河曲县| 普宁市| 屯留县| 大余县| 灵武市| 如皋市| 新蔡县| 南阳市| 永修县| 汤原县| 石柱| 西平县| 永宁县| 安达市| 德令哈市| 荣昌县| 阳城县| 抚远县| 上栗县| 改则县| 会昌县| 永康市| 鹿邑县| 胶南市| 泾川县| 滦南县| 杂多县| 桃园县| 云阳县| 张家川| 黔西县| 澳门| 宜宾县| 遵义县| 内丘县|