国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現的批量下載RFC文檔

2020-02-23 00:17:53
字體:
來源:轉載
供稿:網友

RFC文檔有很多,有時候在沒有聯網的情況下也想翻閱,只能下載一份留存本地了。
看了看地址列表,大概是這個范圍:
http://www.networksorcery.com/enp/rfc/rfc1000.txt
...
http://www.networksorcery.com/enp/rfc/rfc6409.txt

哈哈,很適合批量下載,第一個想到的就是迅雷……
可用的時候發現它只支持三位數的擴展(用的是迅雷7),我想要下的剛好是四位數……
郁悶之下萌生自己做一個的想法!
這東西很適合用python做,原理很簡單,代碼也很少,先讀為快。
代碼如下:
代碼如下:
#! /usr/bin/python
'''
  File      : getRFC.py
  Author    : Mike
  E-Mail    : Mike_Zhang@live.com
'''
import urllib,os,shutil,time

def downloadHtmlPage(url,tmpf = ''):
    i = url.rfind('/')
    fileName = url[i+1:]
    if tmpf : fileName = tmpf
    print url,"->",fileName
    urllib.urlretrieve(url,fileName)
    print 'Downloaded ',fileName   
    time.sleep(0.2)
    return fileName
   
# http://www.networksorcery.com/enp/rfc/rfc1000.txt
# http://www.networksorcery.com/enp/rfc/rfc6409.txt
if __name__ == '__main__':
    addr = 'http://www.networksorcery.com/enp/rfc'   
    dirPath = "RFC"
    #startIndex = 1000
    startIndex = int(raw_input('start : '))
    #endIndex = 6409
    endIndex = int(raw_input('end : '))
    if startIndex > endIndex :
        print 'Input error!'       
    if False == os.path.exists(dirPath):
        os.makedirs(dirPath)   
    fileDownloadList = []
    logFile = open("log.txt","w")
    for i in range(startIndex,endIndex+1):
        try:           
            t_url = '%s/rfc%d.txt' % (addr,i)
            fileName = downloadHtmlPage(t_url)
            oldName = './'+fileName
            newName = './'+dirPath+'/'+fileName
            if True == os.path.exists(oldName):
                shutil.move(oldName,newName)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 西乌珠穆沁旗| 婺源县| 瓦房店市| 宁乡县| 浦县| 姜堰市| 班玛县| 昂仁县| 晋城| 综艺| 台南县| 怀安县| 邮箱| 沿河| 明光市| 曲阜市| 石屏县| 怀来县| 汝阳县| 临桂县| 民丰县| 德格县| 海门市| 石门县| 青河县| 五台县| 靖宇县| 普兰店市| 镇宁| 壶关县| 修水县| 景泰县| 荔波县| 江川县| 高台县| 育儿| 拜城县| 彩票| 临汾市| 齐齐哈尔市| 和林格尔县|