文档章节

也谈python使用 pytesser识别验证码

 夜游神
发布于 2014/06/29 11:35
字数 356
阅读 1K
收藏 1

码上生花,ECharts 作品展示赛正式启动!>>>

      一般安装步骤如下:

  1. 安装 PIL, 下载地址:http://www.pythonware.com/products/pil/  最新版本是1.1.7,并只支持 python 2.X版本。在windows环境下,可选择下载 PIL-1.1.7.win32-py2.7.exe 文件并执行后,PIL包会自动安装到 python目录中的lib\site-apckages子文件夹中。

  2. 安装 pytesser  下载地址 ,https://code.google.com/p/pytesser/downloads/detail?name=pytesser_v0.0.1.zip 。下载后展开zip文件到 第一步中的lib\site-apckages文件夹中。

  3. 安装Tesseract OCR engine。下载地址 http://code.google.com/p/tesseract-ocr/downloads/list 。此步很难做,本人从google下载了N次tesseract-ocr-setup-3.02.02.exe 都失败了。最后,从CSDN中成功下载此文件,但在安装时要在线从google中下载相关的Tesseract OCR包,所以总是安装不成功。

        因Tesseract不能安装成功,不能进行OCR识别。但分析pytesser发现,在pytesser包中有一个tesseract.exe文件,pytesser.py中就是调用 tesseract.exe 实现 image到text的识别和转换。所以,在实现简单的英文字母和数字识别时,不需要去下载安装   Tesseract OCR engine ,可直接用pytesser中的tesseract.exe和数据即可。

      还有最重要的一点:为了保证tesseract.exe能被正常调用执行,必须在windows的环境变量path设置中加入tesseract.exe的路径。

© 著作权归作者所有

粉丝 12
博文 14
码字总数 8786
作品 0
武汉
私信 提问
加载中
请先登录后再评论。
Python 代码实现验证码识别

Python 代码实现验证码识别 测试开发社区 1周前 源 / j_hao104 一、探讨 识别图形验证码可以说是做爬虫的必修课,涉及到计算机图形学,机器学习,机器视觉,人工智能等等高深领域…… 简单地...

osc_0xf6ethk
2019/07/29
3
0
Python:IOError: image file is truncated 的解决办法

代码如下: #coding:utf-8from PIL import Imageimport pytesseractdef test(): 执行以上代码进行简单验证码识别的时候会抛出一个异常: Traceback (most recent call last):File "D:testvc......

曾是土木人
2015/04/18
0
0
Python+selenium+pil+tesseract实现自动识别验证码

一、环境搭建准备: 1.Python下载,安装以及环境配置 2.IDE pycharm 工具下载,安装 3.ie浏览器 4.selenium 5.pil:pil第三方库的下载,win下安装whl文件,下载后是一个exe,直接双击安装,它...

osc_dl4yv4ox
2018/06/13
3
0
使用pytesser破解验证码

Tesseract是一款开源 OCR(Optical Character Recognition,光学字符识别)软件。所谓OCR是图像识别领域中一个子领域,该领域专注于对图片中的文字信息进行识别并转换成能被常规文本编辑器编...

以王姓自居
2018/03/21
0
0
Python验证码识别:利用pytesser识别简单图形验证码

一、探讨 识别图形验证码可以说是做爬虫的必修课,涉及到计算机图形学,机器学习,机器视觉,人工智能等等高深领域…… 简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形...

j_hao104
2016/03/25
2.3W
2

没有更多内容

加载失败,请刷新页面

加载更多

超简单集成华为HMS Scankit扫码SDK实现扫一扫二维码

前言 查看华为开发者联盟网站的机器学习服务业务介绍(https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-introduction-4) 官网的Demo和Sample代码体验 官网有Demo可...

HMS-Core
7分钟前
7
0
JavaScript学习笔记-01基础

弹出框 alert('我是编程语言,来控制电脑网页弹出你好'); JS三种: (1) 行内式,直接写到直接写到元素的内部 <input type="button" value="submit" onclick="alert('sure?')"> (2) 内嵌式的j......

黑黑的豆
17分钟前
12
0
PowerShell说“此系统上的脚本执行被禁用。” - PowerShell says “execution of scripts is disabled on this system.”

问题: I am trying to run a cmd file that calls a powershell script from cmd.exe , and I am getting the below error: 我正在尝试运行一个从cmd.exe调用powershell脚本的cmd文件,并且......

javail
27分钟前
11
0
LayUi的动态表格table中设置下拉框Select编辑器

相关阅读: X-admin2.2打开页面(添加弹窗),执行成功后如何关闭弹出窗口和刷新table表格内容? 基于X-admin2.2的后台管理系统登录实现 Spring Boot+JPA微服务中数据更新问题(update) Spri...

十点数据
30分钟前
19
0
UltraEdit for Mac 20.00.0.32 文本编辑器

MacOS上最受欢迎的文本编辑器是哪款?UltraEdit Mac版支HTML、PHP、Perl、Java 和 JavaScript 等众多流行计算机高级语言的程序编辑器,Ultraedit与Notepad ++相比。你可以直接用它来修改exe...

麦克W
36分钟前
10
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部