国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

python批量下載圖片的三種方法

2020-02-23 04:52:51
字體:
來源:轉載
供稿:網友

有三種方法,一是用微軟提供的擴展庫win32com來操作IE,二是用selenium的webdriver,三是用python自帶的HTMLParser解析。win32com可以獲得類似js里面的document對象,但貌似是只讀的(文檔都沒找到)。selenium則提供了Chrome,IE,FireFox等的支持,每種瀏覽器都有execute_script和find_element_by_xx方法,可以方便的執行js腳本(包括修改元素)和讀取html里面的元素。不足是selenium只提供對python2.6和2.7的支持。HTMLParser則是需要自己寫個類繼承基類,重寫解析元素的方法。個人感覺selenium用起來更方便,很容易操作html里的元素。
代碼如下:

win32com:
代碼如下:

#將滾動條滑到底,最多滑動20000像素
#模擬鍵盤右鍵,查看多張圖片
import sys
import win32com.client,win32api
import urllib.request
import time
import os

def main():
    #獲取參數
    url=sys.argv[1]
    #操作IE
    ie=win32com.client.Dispatch("InternetExplorer.Application")
    ie.Navigate(url)
    ie.Visible=True
    last_url=''
    dir_name=''
    while last_url!=url:
        print('/nThe URL is:',url,'/n')
        while ie.ReadyState != 4:   
            time.sleep(1)
        while ie.Document.readyState != "complete":
            time.sleep(1)
        #滑動滾動條
        win=ie.Document.parentWindow
        lastY=-1;
        for i in range(40):
            win.scrollTo(0,500*i)
            nowY=win.pageYOffset
            if(nowY==lastY):
                break
            lastY=nowY
            time.sleep(0.4)
        print('Document load state:',ie.Document.readyState)
        doc=ie.Document
        #第一次需要創建目錄
        if(dir_name==''):
            root_dir='E://img'
            dir_name=root_dir+'//'+doc.title
            dir_name=dir_name.replace('|','-')

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 长沙县| 揭阳市| 兴城市| 武陟县| 嘉黎县| 永德县| 辉南县| 金昌市| 黔西| 濮阳市| 濮阳市| 盐亭县| 咸阳市| 兰州市| 海丰县| 永城市| 东宁县| 平定县| 碌曲县| 永州市| 长葛市| 桦南县| 吉首市| 澳门| 古蔺县| 波密县| 封丘县| 易门县| 卢湾区| 内黄县| 蒙山县| 教育| 云霄县| 嘉黎县| 绵竹市| 新乡市| 民乐县| 瓮安县| 晋中市| 乐昌市| 丁青县|