您的位置:68399皇家赌场 > 集群主机 > 选择Python破解验证码,几分钟就够了!

选择Python破解验证码,几分钟就够了!

发布时间:2019-08-31 11:37编辑:集群主机浏览(95)

    化解ecplise phthon2.7中接纳pytesser和tesseract进行ocr,出现报错的主题材料,ecplisepytesser

    互连网海人民广播广播台湾大学应用ecplise phthon2.7中选取pytesser或然tesseract进行OC福特Explorer网址验证码的案例,但配备起来其实令人家徒四壁。

    通用步骤:
    1、下载了pytesser_v0.0.1;

    2、然后解压后拷贝到C:ProgramDataAnaconda2Libsite-packages;

    3、文件夹名字改为pytesser;

    4、然后在C:ProgramDataAnaconda2Libsite-packages文件夹下新建贰个文件,起名字为pytesser.pth,内容为pytesser

    5、然后在C:ProgramDataAnaconda2Libsite-packagespytesserpytesser.py文件中第六行,改造import Image  为 from PIL import Image;

    6、然后在ecplice分界面中写代码:

    from PIL import Image    
    from pytesser import * im = Image.open('C:\ProgramData\Anaconda2\Lib\site-packages\pytesser\phototest.tif')
    im.show()
    

    没难题,图片顺遂的开拓了。

    7、然后调用了下oC奥迪Q3的函数:

    print image_to_string(im)
    

    接下来就无穷点不清的报错。

    ecplice的失实提示还毫不帮衬,只提醒:

    Traceback (most recent call last):
      File "C:UsersTF-2016Desktopspiderruijieruijie.py", line 33, in <module>
        print image_file_to_string('11.png', graceful_errors=True)
      File "C:Python27libsite-packagespytesserpytesser.py", line 48, in image_file_to_string
        call_tesseract(filename, scratch_text_name_root)
      File "C:Python27libsite-packagespytesserpytesser.py", line 23, in call_tesseract
        proc = subprocess.Popen(args)
      File "C:Python27libsubprocess.py", line 710, in __init__
        errread, errwrite)
      File "C:Python27libsubprocess.py", line 958, in _execute_child
        startupinfo)
    WindowsError: [Error 2] 
    

    英特网找了八个小时,相当多人遇上这么些题材,差不离一贯不缓和的,最终发掘有一些人会聊起了:

    • #### qq_38717146

      2017-05-09 17:454楼

      1条回复

       回复

    • 刚刚碰巧给消除了。找到你的pytesseract.py这么些文件,将个中的tesseract_cmd = 'tesseract'那行改为tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'即可。

    接下来本人调控下载一个最新版的tesseract 3.0.2版,不再重视pytesseract自带的不行1.01本子了。

    下载后安装,然后在pytesseract.py中把tesseract_exe_name = 'tesseract' # Name of executable to be called at command line  改为:

    tesseract_exe_name = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe' #  'tesseract' Name of executable to be called at command line

    下一场运维,ok了,能够ocr匈牙利(Magyarország)语和数字了。

    但缺憾的是,中文库是谷歌(Google)的网址,下载不下去,若是能下载下来,很期待ocr汉语的功力。

     

    互连网海人民广播电台湾大学行使ecplise phthon2.7中利用pytesser或然tesseract举行OC兰德Escort网...

    2.安装tesseract-ocr,下载地址:,笔者设置的版本tesseract-ocr-setup-3.05.01.exe,安装的时候选取把chi_sim(粤语简体)和chi_tra(中文繁体)数据库安装上

    ①将此路径增加至境况变量path中(可是本身是这么做的,不过PyCharm依旧报错)

    一:windows安装相应的包:

    1.安装pip install pytesseract

    此地要表达的是设置Tesseract-OC揽胜极光后,其不会被暗中认可加多至蒙受变量path中,已造成如下报错:

                1.设置上边包车型地铁包时,必得安插其的遇到变量。

    3.设置遇到变量

    推行命令:pip install E:360三门峡浏览器下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl

               3.安装pytesseract: pip install pytesseract

    Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
    

    进去正题,如何分辨图像普通话字

    前一段时间爬取一些网页数据必要猎取其的验证码,然后拼接url获取数据。然后通过看其验证码方式,正是一些差不离的字母加数字,然后加燥的验证码。然后网络百度了一晃,Python能够做一些轻松易行的验证码破解。具体操作如下:

     方法2:  在.py文件配置中钦点tessdata-dir

    ##选拔pip install autopy3时会报错如下:

     

    例如: C:Program Files (x86)Tesseract-OCR

    ④安装autopy3:

     1 # -*- coding:utf-8 -*-
     2 import sys
     3 reload(sys)
     4 sys.setdefaultencoding('utf-8')
     5 import urllib
     6 from PIL import Image,ImageEnhance
     7 import pytesseract
     8 import requests
     9 import time
    10 import re
    11 from lxml import etree
    12 from PublicCode import search_config
    13 # 破解验证码
    14 #Python学习交流群125240963每天更新资料
    15 t =int(round(time.time()*1000))
    16 
    17 def get_guid(t,second_header):
    18 url='http://cri.gz.gov.cn/Search/NewGuid?t=%s'%t
    19 result =requests.get(url,search_config.second_header)
    20 return result.content
    21 def get_image(guid):
    22 url='http://cri.gz.gov.cn/Search/ValidateCode?t=1517210875615&guid=%s'%guid
    23 
    24 res = requests.get(url)
    25 with open('1.jpg',"wb") as f:
    26 f.write(res.content)
    27 res = Image.open('1.jpg')
    28 
    29 return res
    30 threshold = 150
    31 table = []
    32 for i in range(256):
    33 if i < threshold:
    34 table.append(0)
    35 else:
    36 table.append(1)
    37 def getverify1(name):
    38 im = Image.open(name)
    39 imgry = im.convert('L')
    40 imgry.save('g'   name)
    41 out = imgry.point(table, '1')
    42 out.save('b'   name)
    43 string = '--tessdata-dir "C:\Program Files (x86)\Tesseract-OCR\tessdata"'
    44 im = Image.open('b1.jpg')
    45 enhancer = ImageEnhance.Contrast(im)
    46 im = enhancer.enhance(6)
    47 text = pytesseract.image_to_string(im, config=string)
    48 text = text.strip('')
    49 text = text.upper();
    50 
    51 return text
    52 def main():
    53 guid = get_guid(t, search_config.second_header)
    54 get_image(guid)
    55 date = getverify1('1.jpg')
    56 return guid,date
    

    5.

    ②安装pytesser3:pip install pytesser3

                 2.修改pytesseract.py的:

    本文由68399皇家赌场发布于集群主机,转载请注明出处:选择Python破解验证码,几分钟就够了!

    关键词: 68399皇家赌场 Python