国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python采集代理ip并判斷是否可用和定時更新的方法

2020-02-23 00:02:32
字體:
供稿:網(wǎng)友

網(wǎng)上有很多免費(fèi)的ip地址,都是可以使用的,但是如果手動來獲取太麻煩,這里通過Python自動抓取,可以批量獲取。

代碼如下:

# -*- coding: utf-8 -*-import reimport urllib2import jsonimport osimport timeimport socketclass ProxyIp(object):  def __init__(self):    self.path = os.path.split(os.path.realpath(__file__))[0]  # Get latest proxy ip and download to json  def update_ip(self):    print 'Update Ip'    url = 'http://www.ip3366.net/free/'    req = urllib2.Request(url)    response = urllib2.urlopen(req)    matches = re.findall(      ur'(/d+./d+./d+./d+)</td>/s+<td>(/d+)</td>/s+<td>.*?</td>/s+<td>(HTTPS?)</td>',      response.read(),      re.I    )    ls = []    for match in matches:      if self.is_open(match[0], match[1]):        ls.append({'ip':match[0], 'port':match[1], 'protocol': match[2]})    with open('%s/ip.json' % self.path, 'w') as f:      json.dump(ls, f)    return ls  # whether the ips is last or old.  def is_last(self):    m_time = int(os.path.getmtime('%s/ip.json' % self.path))    now_time = int(time.time())    return (now_time - m_time) > 60*60*4 # 4 hours  @staticmethod  def is_open(ip, port):    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)    try:      s.connect(ip, int(port))      return True    except:      print 'Faild IP: %s:%s' % (ip, port)      return False  def get_proxy_ips(self):    if not self.is_last():      return self.update_ip()    else:      with open('%s/ip.json' % self.path, 'r') as f:        return json.load(f)

以上這篇Python采集代理ip并判斷是否可用和定時更新的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持武林站長站。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 和平县| 出国| 丹阳市| 石门县| 中牟县| 大宁县| 徐州市| 鄂伦春自治旗| 南昌县| 永宁县| 冷水江市| 云霄县| 苏尼特右旗| 孝感市| 东丰县| 西吉县| 柏乡县| 岳西县| 堆龙德庆县| 汕尾市| 遵义县| 临泽县| 宣化县| 都昌县| 怀仁县| 雷波县| 托里县| 苗栗市| 宝坻区| 吴忠市| 开封县| 张掖市| 遵义县| 玉树县| 通许县| 乐陵市| 布拖县| 哈密市| 平顶山市| 肇庆市| 玉龙|