国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python實現的百度站長自動URL提交小工具

2020-02-23 05:30:23
字體:
來源:轉載
供稿:網友

URL提交是百度提供的一個站長工具,用于給站長提供手工收錄某些URL的接口,但是該接口有驗證碼識別部分,比較難弄。所以編寫了如下程序進行驗證碼自動識別:

主要思路

獲取多個驗證碼,提交到 http://lab.ocrking.com/ 進行多次識別,然后計算每個驗證碼圖片識別出來的 字母或數字 進行統計,得出統計率最高的 即為驗證碼。

代碼如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import requests
import time
import json
import re
 
 
if __name__ == "__main__":
    i = 1
    s = requests.session()
    s.headers.update({'Referer':'http://zhanzhang.baidu.com/sitesubmit/index','User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/33.0.1750.154 Safari/537.36'})
    r = s.get('http://zhanzhang.baidu.com/sitesubmit/index')
    s2 = requests.session()
    r = s.post('http://zhanzhang.baidu.com/captcha',data={'async':'false','n':time.time()})
    url = json.loads(r.content)['url']
    temp = []
    while 1:
        try:
            r = s.get(url)
            img_data = r.content
            r = s2.get('http://lab.ocrking.com/')
            try:
                content = ' '.join(r.content.split())
                sid =  re.findall(r'"sid" : "(.+?)"',content)[0]
                hash_1 = re.findall(r'"hash" : "(.+?)"',content)[0]
                timestamp = re.findall(r'"timestamp" : "(.+?)"',content)[0]
            except:
                print 'error on get orking info!'
                continue
            files = {'Filedata':('icode.jpeg', img_data)}
            data  = {'Filename':'icode.jpeg','sid':sid,'hash':hash_1,'timestamp':timestamp}
            r = s2.post('http://lab.ocrking.com/upload.html',files = files,data= data)

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 庐江县| 鹤山市| 天镇县| 策勒县| 新乐市| 贵定县| 无锡市| 信阳市| 博爱县| 武强县| 东乌| 鄂伦春自治旗| 天长市| 耒阳市| 濮阳市| 威宁| 义马市| 巍山| 五常市| 伊宁市| 马公市| 福安市| 伊宁市| 佛学| 体育| 瑞安市| 莒南县| 万宁市| 宜都市| 瑞昌市| 新野县| 泉州市| 新邵县| 深水埗区| 门源| 大田县| 金沙县| 文安县| 通榆县| 教育| 华池县|