国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > Python > 正文

一則python3的簡(jiǎn)單爬蟲(chóng)代碼

2019-11-25 18:24:40
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

不得不說(shuō)python的上手非常簡(jiǎn)單。在網(wǎng)上找了一下,大都是python2的帖子,于是隨手寫了個(gè)python3的。代碼非常簡(jiǎn)單就不解釋了,直接貼代碼。

復(fù)制代碼 代碼如下:

#test rdp
import urllib.request
import re<br>
#登錄用的帳戶信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登錄地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登錄
res = urllib.request.urlopen(url,postdata)
#取得頁(yè)面html<br>strResult=(res.read().decode('utf-8'))
#用正則表達(dá)式取出所有A標(biāo)簽
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的內(nèi)容,group(2)是a標(biāo)簽里的文字

關(guān)于cookie、異常等處理看了一下,沒(méi)有花時(shí)間去處理,畢竟只是想通過(guò)寫爬蟲(chóng)來(lái)學(xué)習(xí)python。

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 莒南县| 广元市| 涪陵区| 宜良县| 玉树县| 玛沁县| 甘泉县| 沁阳市| 罗城| 莱西市| 八宿县| 周宁县| 宜川县| 永顺县| 南充市| 日喀则市| 曲阳县| 太和县| 乌拉特前旗| 宜黄县| 涿鹿县| 莎车县| 吴忠市| 鹤峰县| 多伦县| 嘉峪关市| 明星| 湘潭市| 潮州市| 临沧市| 叶城县| 交口县| 赣榆县| 宁德市| 镇平县| 烟台市| 蕲春县| 萨嘎县| 墨玉县| 葫芦岛市| 渝中区|