CentOs install Tesseract
博客专区 > coord 的博客 > 博客详情
CentOs install Tesseract
coord 发表于2年前
CentOs install Tesseract
  • 发表于 2年前
  • 阅读 146
  • 收藏 1
  • 点赞 1
  • 评论 0

腾讯云 新注册用户 域名抢购1元起>>>   

摘要: CentOs install Tesseract
    1. 安装依赖包

      yum install gcc gcc-c++ make

      yum install autoconf automake libtool

      yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

    2. 源码安装leptonica

      下载

      wget  http://www.leptonica.org/source/leptonica-1.72.tar.gz

                解压

                tar xf leptonica-1.72.tar.gz

                cd  leptonica-1.72

                ./configure && make && sudo make install


2. 源码安装Tesseract

        1)下载

        wget https://github.com/tesseract-ocr/tesseract/archive/master.zip

        2)安装

        ./autogen.sh

        configure && make && make install

        ldconfig

        3) 设置环境变量

        cd

        vi .bashrc

        #在最后添加

        export TESSDATA_PREFIX=/usr/local/share

        source .bashrc #使之生效

    

        3) 下载tessdata

        git clone https://github.com/tesseract-ocr/tessdata.git

            # 把训练好的数据给放到tessdata中

           cp tessdata /usr/local/share -R


3. 测试

    cd /root/tesseract-master/testing

    tesseract phototest.tif phototest -l eng

    [root@SZB-L0006409 testing]# pwd

    /root/tesseract-master/testing

    [root@SZB-L0006409 testing]# tesseract phototest.tif phototest -l eng

    Tesseract Open Source OCR Engine v3.05.00dev with Leptonica

    Page 1

    Warning in pixReadMemTiff: tiff page 1 not found


5. 安装pytesseract

    pip install pytesseract

from PIL import Image
import pytesseract
print pytesseract.image_to_string(Image.open('2ca28b68994436891d3b99a3612aa87c.jpg'))
共有 人打赏支持
粉丝 3
博文 38
码字总数 8502
×
coord
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: