Pillow + pytesseract + tesseract-ocr 破解简单的图形验证码

2023-06-25,,

前言:

我们在做WEB UI自动化测试时,会遇到一些图形验证码,今天就来简单介绍下,如何来识别简单的图形验证码。

一、安装

◇ Pillow

pip3 install Pillow

◇ pytesseract

pip3 install pytesseract

◇ tesseract-ocr

下载地址: https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w32-setup-v4.0.0-beta.1.20180608.exe

二、使用

1.在pytesseract源码中将tesseract_cmd=‘’改为本地安装的tesseract-ocr 的目录

2.如何找到pytesseract.py

按住Ctrl 点击 pytesseract

再次按住Ctrl 点击 ALTONotSupported

搜索tesseract_cmd即可找到

三、示例

# coding = utf-8

import pytesseract
from PIL import Image
from PIL import ImageEnhance def readImage(path):
img = Image.open(path) # 根据地址,读取图片
imgry = img.convert('L') # 图像加强,二值化
sharpness = ImageEnhance.Contrast(imgry) # 对比度增强
sharp_img = sharpness.enhance(2.0)
sharp_img.save("bky.png") # 将处理后的图片,保存为new.png
image = Image.open('bky.png') # 打开处理后的图片
code = pytesseract.image_to_string(image) # 读取里面的内容
return code if __name__=="__main__":
path = 'img.png'
pic = readImage(path)
print("识别结果:",pic)

                            to be continued...

Pillow + pytesseract + tesseract-ocr 破解简单的图形验证码的相关教程结束。

《Pillow + pytesseract + tesseract-ocr 破解简单的图形验证码.doc》

下载本文的Word格式文档,以方便收藏与打印。