文档章节

CentOs install Tesseract

coord
 coord
发布于 2016/04/21 10:38
字数 197
阅读 326
收藏 1
点赞 1
评论 0
    1. 安装依赖包

      yum install gcc gcc-c++ make

      yum install autoconf automake libtool

      yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    2. 源码安装leptonica

      下载

      wget  http://www.leptonica.org/source/leptonica-1.72.tar.gz

                解压

                tar xf leptonica-1.72.tar.gz

                cd  leptonica-1.72

                ./configure && make && sudo make install


2. 源码安装Tesseract

        1)下载

        wget https://github.com/tesseract-ocr/tesseract/archive/master.zip

        2)安装

        ./autogen.sh

        configure && make && make install

        ldconfig

        3) 设置环境变量

        cd

        vi .bashrc

        #在最后添加

        export TESSDATA_PREFIX=/usr/local/share

        source .bashrc #使之生效

    

        3) 下载tessdata

        git clone https://github.com/tesseract-ocr/tessdata.git

            # 把训练好的数据给放到tessdata中

           cp tessdata /usr/local/share -R


3. 测试

    cd /root/tesseract-master/testing

    tesseract phototest.tif phototest -l eng

    [root@SZB-L0006409 testing]# pwd

    /root/tesseract-master/testing

    [root@SZB-L0006409 testing]# tesseract phototest.tif phototest -l eng

    Tesseract Open Source OCR Engine v3.05.00dev with Leptonica

    Page 1

    Warning in pixReadMemTiff: tiff page 1 not found


5. 安装pytesseract

    pip install pytesseract

from PIL import Image
import pytesseract
print pytesseract.image_to_string(Image.open('2ca28b68994436891d3b99a3612aa87c.jpg'))

© 著作权归作者所有

共有 人打赏支持
coord
粉丝 2
博文 50
码字总数 10713
作品 0
闵行
程序员
OpenKM在线文档库系统 - 安装版

用了将近1周时间,终于能够把OpenKM正式上线了。 下面把安装的过程和配置分享给大家。 OS: CentOS 5.4基本安装 OpenKM: OpenKM 5.1.7 1. 下载OpenKM软件 http://sourceforge.net/projects/op...

yuhaijunll
2011/12/05
0
3
Centos5.5 安装Tesseract-OCR

安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yum install gcc gcc-c++ make 依赖的包: autoconf automake libtool libjpeg-devel libpng-de...

雪人
2012/02/15
0
15
leptonica & tesseract & tess4j

wget http://www.leptonica.org/source/leptonica-1.73.tar.gz tar -zxvf leptonica-1.73.tar.gz cd leptonica-1.73 ./configure && make && sudo make install wget https://github.com/tes......

jiangwu
2016/09/10
62
0
python 验证码问题

tesseract-ocr-setup-3.02.02.exe 下载地址:https://sourceforge.net/projects/tesseract-ocr-alt/files/tesseract-ocr-setup-3.02.02.exe/download?usemirror=jaist&r=https%3A%2F%2Fsourc......

lweihua
2017/06/12
0
0
Java 图片提取验证码

安装 Tesseract-OCR Windows 版本 tesseract-ocr-setup-xx.xx.exe chi_sim.traineddata.gz 中文语言包 这两个请自行百度即可,然后我们将其安装在D:下,其中将语言包放在安装目录下的tessdat...

逝去的回忆
2016/12/05
160
0
Mac下Tesseract-OCR文字识别新手使用入门

引 最近要倒腾一下文字识别,直接上手iOS的识别遇到了一些困难,于是决定先在Mac上做一做,会比较简单。 有一个经常听到的词汇叫做OCR,OCR是什么呢?Optical Character Recognition,光学字...

cloudox_
2017/06/02
0
0
linux下安装使用pytesser,图片文本识别

pytesser是一个用于图片文本识别的python模块:http://code.google.com/p/pytesser/,即从文本的截图中还原出文本信息; 网上在windows上安装、使用的资料比较多,而没有linux的资料; 作者虽...

鉴客
2012/06/28
8.7K
3
JesusSlim/vcodereader

vcodereader A golang tool to read verify code. How to use install tesseract-ocr install go install gosseract install vcodereader run the example:vcodereader/example/example.go 如......

JesusSlim
2016/05/07
0
0
Python外部模块介绍- pyocr 光学字符串识别 验证码破解相关

Python外部模块介绍- pyocr光学字符串识别 2013-05-24磁针石 #承接软件自动化实施与培训等gtalk:ouyangchongwu#gmail.comqq 37391319 博客:http://blog.csdn.net/oychw #版权所有,转载刊登...

长平狐
2013/12/25
1K
0
ubuntu14.04 安装有道词典

由于安装有道过程中出现很多问题记录一下查找及解决方法: 有道词典youdao-dict1.1.0-0-ubuntuamd64.deb版本 安装过程出现依赖问题: 解决方式,先执行如下操作,原文地址:http://www.cnblog...

weixin_41015581
04/22
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Android 复制和粘贴功能

做了一回搬运工,原文地址:https://blog.csdn.net/kennethyo/article/details/76602765 Android 复制和粘贴功能,需要调用系统服务ClipboardManager来实现。 ClipboardManager mClipboardM...

她叫我小渝
30分钟前
0
0
拦截SQLSERVER的SSL加密通道替换传输过程中的用户名密码实现运维审计(一)

工作准备 •一台SQLSERVER 2005/SQLSERVER 2008服务 •SQLSERVER jdbc驱动程序 •Java开发环境eclipse + jdk1.8 •java反编译工具JD-Core 反编译JDBC分析SQLSERVER客户端与服务器通信原理 SQ...

紅顏為君笑
47分钟前
4
0
jQuery零基础入门——(六)修改DOM结构

《jQuery零基础入门》系列博文是在廖雪峰老师的博文基础上,可能补充了个人的理解和日常遇到的点,用我的理解表述出来,主干出处来自廖雪峰老师的技术分享。 在《零基础入门JavaScript》的时...

JandenMa
今天
0
0
linux mint 1.9 qq 安装

转: https://www.jianshu.com/p/cdc3d03c144d 1. 下载 qq 轻聊版,可在百度搜索后下载 QQ7.9Light.exe 2. 去wine的官网(https://wiki.winehq.org/Ubuntu) 安装 wine . 提醒网页可以切换成中...

Canaan_
今天
0
0
PHP后台运行命令并管理运行程序

php后台运行命令并管理后台运行程序 class ProcessModel{ private $pid; private $command; private $resultToFile = ''; public function __construct($cl=false){......

colin_86
今天
1
0
数据结构与算法4

在此程序中,HighArray类中的find()方法用数据项的值作为参数传递,它的返回值决定是否找到此数据项。 insert()方法向数组下一个空位置放置一个新的数据项。一个名为nElems的字段跟踪记录着...

沉迷于编程的小菜菜
今天
1
1
fiddler安装和基本使用以及代理设置

项目需求 由于开发过程中客户端和服务器数据交互非常频繁,有时候服务端需要知道客户端调用接口传了哪些参数过来,这个时候就需要一个工具可以监听这些接口请求参数,已经接口的响应的数据,这种...

银装素裹
今天
0
0
Python分析《我不是药神》豆瓣评论

读取 Mongo 中的短评数据,进行中文分词 对分词结果取 Top50 生成词云 生成词云效果 看来网上关于 我不是药神 vs 达拉斯 的争论很热啊。关于词频统计就这些,代码中也会完成一些其它的分析任...

猫咪编程
今天
0
0
虚拟机怎么安装vmware tools

https://blog.csdn.net/tjcwt2011/article/details/72638977

AndyZhouX
昨天
1
0
There is no session with id[xxx]

参考网页 https://blog.csdn.net/caimengyuan/article/details/52526765 报错 2018-07-19 23:04:35,330 [http-nio-1008-exec-8] DEBUG [org.apache.shiro.web.servlet.SimpleCookie] - Found......

karma123
昨天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部