Centos5.5 安装Tesseract-OCR

原创
2012/02/15 17:23
阅读数 8.5K
安装Tesseract-OCR 
准备工作:
编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)
yum install gcc gcc-c++ make

依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)

1. autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:
yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
2. leptonica 需要源码编译安装
参考资料:
http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113
http://www.leptonica.org/source/README.html
下载 leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gz
解压后切换到 leptonica-1.68 根目录
./configure
make
make install
tesseract安装:
依赖安装完毕后开始安装tesseract
下载 tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到 tesseract-3.01 根目录
(如果在make时遇到类似 strngs.h:1: error: stray '\357' in program 的错误,请将 tesseract-3.01/ccutil/strngs.h 文件转为 ANSI 编码保存,再重新编译)
./autogen.sh
./configure
make
make install
ldconfig
tesseract英文语言包安装:
下载 tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
解压后将 tesseract-ocr/tessdata 下的所有文件全部拷贝到 /usr/local/share/tessdata 下
安装完毕.
测试一下:
切换到解压后的 tesseract-3.01 根目录(这个目录下有一个自带的 phototest.tif 可以做测试用)
命令行:
tesseract phototest.tif phototest -l eng

输出:
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0

这时应该在当前目录生成一个 phototest.txt 文本文件,内容就是 phototest.tif 显示的文字.

展开阅读全文
打赏
1
6 收藏
分享
加载中
雪人博主

引用来自“夜清澄”的评论

大佬 打扰下 虽然挖个坟有点那啥 但是实在是解决不了
我遇到了这个错 请问一下是怎么解决的
Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Error in pixReadMemPng: function not present
Error in pixReadMem: png: no pix returned
Error during processing.
参考:https://blog.csdn.net/airk000/article/details/23876389
2018/07/31 15:38
回复
举报
大佬 打扰下 虽然挖个坟有点那啥 但是实在是解决不了
我遇到了这个错 请问一下是怎么解决的
Tesseract Open Source OCR Engine v3.04.00 with Leptonica
Error in pixReadMemPng: function not present
Error in pixReadMem: png: no pix returned
Error during processing.
2018/07/24 10:09
回复
举报

引用来自“郭东波”的评论

你好,我想问一下,我按照你的步骤安装,出现了
Tesseract Open Source OCR Engine v3.01 with Leptonica
Error in pixReadStreamGif: function not present
Error in pixReadStream: gif: no pix returned
Error in pixRead: pix not read
Unsupported image type.
怎么可以解决一下,万分紧急,谢谢

哥们你这个问题我也碰到了 我是把 leptonica 卸载了 重新编译安装了下 就好了
2012/12/06 14:27
回复
举报
雪人博主

引用来自“G.Conanca”的评论

引用来自“雪人”的评论

引用来自“G.Conanca”的评论

引用来自“郭东波”的评论

你好,我想问一下,我按照你的步骤安装,出现了
Tesseract Open Source OCR Engine v3.01 with Leptonica
Error in pixReadStreamGif: function not present
Error in pixReadStream: gif: no pix returned
Error in pixRead: pix not read
Unsupported image type.
怎么可以解决一下,万分紧急,谢谢

yum install giflib-devel

亲自试过吗?GIF好像没这么简单哦

试过非多帧的,如:
http://www.poseidonpools.com.au/images/gallery-text.gif

我一般用 ImageMagick 转成统一的格式处理
2012/05/27 19:05
回复
举报

引用来自“雪人”的评论

引用来自“G.Conanca”的评论

引用来自“郭东波”的评论

你好,我想问一下,我按照你的步骤安装,出现了
Tesseract Open Source OCR Engine v3.01 with Leptonica
Error in pixReadStreamGif: function not present
Error in pixReadStream: gif: no pix returned
Error in pixRead: pix not read
Unsupported image type.
怎么可以解决一下,万分紧急,谢谢

yum install giflib-devel

亲自试过吗?GIF好像没这么简单哦

试过非多帧的,如:
http://www.poseidonpools.com.au/images/gallery-text.gif
2012/05/27 17:58
回复
举报
雪人博主

引用来自“G.Conanca”的评论

引用来自“郭东波”的评论

你好,我想问一下,我按照你的步骤安装,出现了
Tesseract Open Source OCR Engine v3.01 with Leptonica
Error in pixReadStreamGif: function not present
Error in pixReadStream: gif: no pix returned
Error in pixRead: pix not read
Unsupported image type.
怎么可以解决一下,万分紧急,谢谢

yum install giflib-devel

亲自试过吗?GIF好像没这么简单哦
2012/05/26 00:35
回复
举报

引用来自“郭东波”的评论

你好,我想问一下,我按照你的步骤安装,出现了
Tesseract Open Source OCR Engine v3.01 with Leptonica
Error in pixReadStreamGif: function not present
Error in pixReadStream: gif: no pix returned
Error in pixRead: pix not read
Unsupported image type.
怎么可以解决一下,万分紧急,谢谢

yum install giflib-devel
2012/05/25 21:36
回复
举报
雪人博主
该评论暂时无法显示,详情咨询 QQ 群:912889742
雪人博主

引用来自“lixuan3”的评论

当我使用tesseract phototest.tif phototest -l eng命令时,出现如下错误:
actual_tessdata_num_entries_ <= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file tessdatamanager.cpp, line 56
Segmentation fault

原码我没有改动,如何修改??
您能否告知我,你的邮箱,我现在在学习Tesseract-OCR的开发,但不会!有资料分享吗?

看上去好像是语言包有问题,贴一下你安装t-ocr的一些信息吧,版本什么的.^^
2012/05/14 10:10
回复
举报
该评论暂时无法显示,详情咨询 QQ 群:912889742
更多评论
打赏
17 评论
6 收藏
1
分享
返回顶部
顶部