国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

一則python3的簡單爬蟲代碼

2020-02-23 05:23:27
字體:
來源:轉載
供稿:網(wǎng)友

不得不說python的上手非常簡單。在網(wǎng)上找了一下,大都是python2的帖子,于是隨手寫了個python3的。代碼非常簡單就不解釋了,直接貼代碼。

代碼如下:
#test rdp
import urllib.request
import re<br>
#登錄用的帳戶信息
data={}
data['fromUrl']=''
data['fromUrlTemp']=''
data['loginId']='12345'
data['password']='12345'
user_agent='Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
#登錄地址
#url='http://192.168.1.111:8080/loginCheck'
postdata = urllib.parse.urlencode(data)
postdata = postdata.encode('utf-8')
headers = { 'User-Agent' : user_agent }
#登錄
res = urllib.request.urlopen(url,postdata)
#取得頁面html<br>strResult=(res.read().decode('utf-8'))
#用正則表達式取出所有A標簽
p = re.compile(r'<a href="(.*?)".*?>(.*?)</a>')
for m in p.finditer(strResult):
    print (m.group(1))#group(1)是href里面的內(nèi)容,group(2)是a標簽里的文字

關于cookie、異常等處理看了一下,沒有花時間去處理,畢竟只是想通過寫爬蟲來學習python。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 资溪县| 遵化市| 沙雅县| 衡东县| 安塞县| 鄢陵县| 丰县| 手机| 乐都县| 福鼎市| 康保县| 漳浦县| 郴州市| 莱阳市| 苍山县| 康平县| 黔南| 黎平县| 缙云县| 新源县| 金沙县| 固镇县| 淄博市| 开江县| 苗栗市| 漯河市| 临汾市| 西丰县| 宜昌市| 沅陵县| 涿鹿县| 张家川| 云和县| 呼图壁县| 和静县| 宾阳县| 广州市| SHOW| 大余县| 乐陵市| 大港区|