文档章节

CentOs install Tesseract

coord
 coord
发布于 2016/04/21 10:38
字数 197
阅读 358
收藏 1
    1. 安装依赖包

      yum install gcc gcc-c++ make

      yum install autoconf automake libtool

      yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    2. 源码安装leptonica

      下载

      wget  http://www.leptonica.org/source/leptonica-1.72.tar.gz

                解压

                tar xf leptonica-1.72.tar.gz

                cd  leptonica-1.72

                ./configure && make && sudo make install


2. 源码安装Tesseract

        1)下载

        wget https://github.com/tesseract-ocr/tesseract/archive/master.zip

        2)安装

        ./autogen.sh

        configure && make && make install

        ldconfig

        3) 设置环境变量

        cd

        vi .bashrc

        #在最后添加

        export TESSDATA_PREFIX=/usr/local/share

        source .bashrc #使之生效

    

        3) 下载tessdata

        git clone https://github.com/tesseract-ocr/tessdata.git

            # 把训练好的数据给放到tessdata中

           cp tessdata /usr/local/share -R


3. 测试

    cd /root/tesseract-master/testing

    tesseract phototest.tif phototest -l eng

    [root@SZB-L0006409 testing]# pwd

    /root/tesseract-master/testing

    [root@SZB-L0006409 testing]# tesseract phototest.tif phototest -l eng

    Tesseract Open Source OCR Engine v3.05.00dev with Leptonica

    Page 1

    Warning in pixReadMemTiff: tiff page 1 not found


5. 安装pytesseract

    pip install pytesseract

from PIL import Image
import pytesseract
print pytesseract.image_to_string(Image.open('2ca28b68994436891d3b99a3612aa87c.jpg'))

© 著作权归作者所有

共有 人打赏支持
coord
粉丝 2
博文 52
码字总数 10879
作品 0
闵行
程序员
OpenKM在线文档库系统 - 安装版

用了将近1周时间,终于能够把OpenKM正式上线了。 下面把安装的过程和配置分享给大家。 OS: CentOS 5.4基本安装 OpenKM: OpenKM 5.1.7 1. 下载OpenKM软件 http://sourceforge.net/projects/op...

yuhaijunll
2011/12/05
0
3
Centos5.5 安装Tesseract-OCR

安装Tesseract-OCR 准备工作: 编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yum install gcc gcc-c++ make 依赖的包: autoconf automake libtool libjpeg-devel libpng-de...

雪人
2012/02/15
0
15
centos7 yum 安装 tesseract pip 安装 python3 tesserocr

centos7 系统 yum 安装 tesseract,并 pip 安装 python3 的 tesserocr 2018年09月04日 00:00:27 阅读数:15 标签: centos7python3tesserocr 更多 个人分类: python 版权声明:本文为博主原...

linjin200
09/10
0
0
leptonica & tesseract & tess4j

wget http://www.leptonica.org/source/leptonica-1.73.tar.gz tar -zxvf leptonica-1.73.tar.gz cd leptonica-1.73 ./configure && make && sudo make install wget https://github.com/tes......

jiangwu
2016/09/10
62
0
Java 图片提取验证码

安装 Tesseract-OCR Windows 版本 tesseract-ocr-setup-xx.xx.exe chi_sim.traineddata.gz 中文语言包 这两个请自行百度即可,然后我们将其安装在D:下,其中将语言包放在安装目录下的tessdat...

逝去的回忆
2016/12/05
160
0

没有更多内容

加载失败,请刷新页面

加载更多

白话SpringCloud | 第五章:服务容错保护(Hystrix)

前言 前一章节,我们知道了如何利用RestTemplate+Ribbon和Feign的方式进行服务的调用。在微服务架构中,一个服务可能会调用很多的其他微服务应用,虽然做了多集群部署,但可能还会存在诸如网...

oKong
23分钟前
0
0
【解惑】领略Java内部类的“内部”

内部类有两种情况: (1) 在类中定义一个类(私有内部类,静态内部类) (2) 在方法中定义一个类(局部内部类,匿名内部类) 1、私有内部类 —— 在方法之间定义的内部类,非静态 我们首先看看类中...

偶尔诗文
今天
1
0
sqlserver 2008 r2 直接下载地址(百度云)

之前下载的sqlserver2008发现不能附加,就卸载了,重新找到了sqlserver2008R2的百度云资源 卸载sqlserver2008还是有点麻烦,不过就是需要删除注册表中的信息 自己来回卸载了3次终于重装sqlse...

dillonxiao
今天
1
0
[Java]JVM调优总结 -Xms -Xmx -Xmn -Xss

JVM调优总结 -Xms -Xmx -Xmn -Xss 博客分类: Java General JVM应用服务器电信CMS算法 堆大小设置 JVM 中最大堆大小有三方面限制:相关操作系统的数据模型(32-bt还是64-bit)限制;系统的可...

morpheusWB
今天
2
0
C++ std::function 和 std::bind

C++11提供了std::function和std::bind两个工具,用于引用可调用对象。这些可调用对象包括 普通函数,Lambda表达式,类的静态成员函数,非静态成员函数以及仿函数等。引用可调用对象,可以用于...

yepanl
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部