国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python3實現(xiàn)并發(fā)檢驗代理池地址的方法

2019-11-25 16:33:27
字體:
供稿:網(wǎng)友

本文實例講述了Python3實現(xiàn)并發(fā)檢驗代理池地址的方法。分享給大家供大家參考,具體如下:

#encoding=utf-8#author: walker#date: 2016-04-14#summary: 用協(xié)程/線程池并發(fā)檢驗代理有效性import os, sys, timeimport requestsfrom concurrent import futurescur_dir_fullpath = os.path.dirname(os.path.abspath(__file__))Headers = {      'Accept': '*/*',      'User-Agent': 'Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; .NET4.0C; .NET4.0E)',    }#檢驗單個代理的有效性#如果有效,返回該proxy;否則,返回空字符串def Check(desturl, proxy, feature):  proxies = {'http': 'http://' + proxy}  r = None #聲明  exMsg = None  try:    r = requests.get(url=desturl, headers=Headers, proxies=proxies, timeout=3)  except:    exMsg = '* ' + traceback.format_exc()    #print(exMsg)  finally:    if 'r' in locals() and r:      r.close()  if exMsg:    return ''  if r.status_code != 200:    return ''  if r.text.find(feature) < 0:    return ''  return proxy#輸入代理列表(set/list),返回有效代理列表def GetValidProxyPool(rawProxyPool, desturl, feature):  validProxyList = list()  #有效代理列表  pool = futures.ThreadPoolExecutor(8)  futureList = list()  for proxy in rawProxyPool:    futureList.append(pool.submit(Check, desturl, proxy, feature))  print('/n submit done, waiting for responses/n')  for future in futures.as_completed(futureList):    proxy = future.result()    print('proxy:' + proxy)    if proxy: #有效代理      validProxyList.append(proxy)  print('validProxyList size:' + str(len(validProxyList)))  return validProxyList#獲取原始代理池def GetRawProxyPool():  rawProxyPool = set()  #通過某種方式獲取原始代理池......  return rawProxyPoolif __name__ == "__main__":  rawProxyPool = GetRawProxyPool()  desturl = 'http://...'    #需要通過代理訪問的目標地址  feature = 'xxx'    #目標網(wǎng)頁的特征碼  validProxyPool = GetValidProxyPool(rawProxyPool, desturl, feature)

更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python入門與進階經(jīng)典教程》、《Python URL操作技巧總結(jié)》、《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python文件與目錄操作技巧匯總

希望本文所述對大家Python程序設計有所幫助。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 黄骅市| 江永县| 台东县| 阜平县| 德清县| 慈溪市| 寻乌县| 绥芬河市| 雷州市| 游戏| 崇礼县| 宁远县| 东乡| 探索| 仙游县| 子长县| 东乌珠穆沁旗| 海口市| 文安县| 盘山县| 含山县| 曲周县| 达拉特旗| 蓝山县| 台北县| 马山县| 宁国市| 都兰县| 衡南县| 东丽区| 舒城县| 商水县| 东乌珠穆沁旗| 古丈县| 兴国县| 沁阳市| 策勒县| 西昌市| 新蔡县| 米林县| 新野县|