文档章节

如何在windows上编译Tesseract OCR

yushulx
 yushulx
发布于 2015/01/08 14:38
字数 445
阅读 11155
收藏 6

获取Tesseract源码的方式有很多。可以直接从repo获取,也可以下载压缩包。不过编译的时候往往也会出现各种奇怪的问题。这里介绍如何简单的配置和编译源码。

参考原文:How to Build Tesseract OCR Library on Windows

编译Tesseract

下载

安装

安装过程中勾选Tesseract development files

编译

在安装目录中找到vs2008到工程目录:

找到所有编译相关的库:

打开Visual Studio 2008(没有的可以去官网下载express版本),导入工程编译。最后生成DEBUG和RELEASE两个版本的DLL:libtesseract302d.dll ,libtesseract302.dll

在README中注意这段话:

Dependencies and Licenses
=========================
 
Leptonica is required. (www.leptonica.com). Tesseract no longer compiles
without Leptonica.
Libtiff is no longer required as a direct dependency.

Tesseract依赖Leptonica库,所以再看下Leptonica是怎么编译的。

编译Leptonica

Leptonica是C语言编写的一个图像处理库,支持JPEG, PNG, TIFF,GIF。

下载

编译

把三个包解压,并按照下面的结构组建编译环境:

BuildFolder\
 
  include\
 
  leptonica-1.68\
 
  lib\

BuildFolder\leptonica-1.68 contents:

config\                    Not used for Windows builds
prog\                      Regression tests, examples, utilities
src\                       Source files for liblept
vs2008\                    Visual Studio 2008 specific files
 DLL Debug\                 liblept DLL Debug build output
 DLL Release\               liblept DLL Release build output
 LIB Debug\                 liblept LIB Debug build output
 LIB Release\               liblept LIB Release build output
 prog_projects\             Projects for prog programs
  ioformats_reg\             Sample project for prog\ioformats_reg.exe
   DLL Debug\                 DLL Debug build output for sample project
   DLL Release\               DLL Release build output for sample project
   LIB Debug\                 LIB Debug build output for sample project
   LIB Release\               LIB Release build output for sample project
   ioformats_reg.vcproj       The ioformats_reg project file
 leptonica.sln              The Leptonica solution file
 leptonica.vcproj           The Leptonica project file

打开Visual Studio 2008,导入工程编译。最后生成DEBUG和RELEASE两个版本的DLL:liblept168d.dllliblept168.dll

参考

Leptonica
Leptonica & Visual Studio 2008
Tesseract-ocr

本文转载自:http://www.codepool.biz/ocr/how-to-build-tesseract-ocr-library-on-windows.html

yushulx
粉丝 29
博文 109
码字总数 61815
作品 0
杭州
私信 提问
如何通过Tesseract开源OCR引擎创建Android OCR应用

Tesseract是遵守 Apache License 2.0协议的开源OCR引擎。这里介绍下如何在Android平台编译Tesseract,以及如何快速创建一个简单的OCR应用。 参考原文:Making an Android OCR Application w...

yushulx
2014/12/23
19.1K
3
Java 图片提取验证码

安装 Tesseract-OCR Windows 版本 tesseract-ocr-setup-xx.xx.exe chi_sim.traineddata.gz 中文语言包 这两个请自行百度即可,然后我们将其安装在D:下,其中将语言包放在安装目录下的tessdat...

逝去的回忆
2016/12/05
436
0
安装 Tesserocr (填坑)

转载请注明出处:https://www.jianshu.com/u/5e6f798c903a 环境: Win10_64 Python 3.6.6,安装路径 (后面会用到该路径) 1. 安装 Tesserocr tesserocr 是 Python 下的一个 OCR 识别库,该库本...

曾翔翔
2018/07/19
0
0
Tesseract:安装与命令行使用

Tesseract 是一款被广泛使用的开源 OCR 工具,本文将对其进行简单的介绍. 简介 Tesseract(/'tesərækt/) 这个词的意思是"超立方体",指的是几何学里的四维标准方体,又称"正八胞体"。右图是...

xiaoxin
2018/07/27
112
0
冲顶大会等游戏答题神器 - qanswer

答题神器:《冲顶大会》,《百万英雄》等答题游戏的答题神器,顺利吃鸡! 通过抓取手机屏幕截图经过文字识别,结合搜索引擎给出一个参考值。 分析结果: 结果说明: 结果数:通过题目+答案的...

silenceper
2018/01/12
3.1K
7

没有更多内容

加载失败,请刷新页面

加载更多

为什么Netty的FastThreadLocal速度快

前言 最近在看netty源码的时候发现了一个叫FastThreadLocal的类,jdk本身自带了ThreadLocal类,所以可以大致想到此类比jdk自带的类速度更快,主要快在什么地方,以及为什么速度更快,下面做一...

ksfzhaohui
9分钟前
2
0
资治通鉴解析:无论什么条件,要挟权力做出承诺,都会被清算

电影《满城尽带黄金甲》里有句经典的名言“朕赐给你的,才是你的。朕不给你的,你不能抢。”之所以这段话有名,核心的就是,它揭示了这样一个权力心思:无论什么情况,权力的行使,都不愿意受...

太空堡垒185
13分钟前
1
0
CSS技巧之向下箭头

本文转载于:专业的前端网站➫CSS技巧之向下箭头 思路: 使用◇符号(可在输入法的软键盘找到该符号),使用定位选择位置,并隐藏溢出的上半部分 细点: 1.使用i标签的楷体属性把◇变大 2.给i...

前端老手
30分钟前
1
0
SpringCloud alibaba微服务之NACOS多环境配置整合

前言 伴随着spring cloud alibaba 登上主板以后,我就去了解下感觉还是蛮不错的。说实话第一次看见Nacos好长一段时间连读法都不知道...(/nɑ:kəʊs/)。按照官方的话说Nacos是:一个更易于...

攻城狮-飞牛
32分钟前
2
0
tcpdump

tcpdump -A -s0 port 21011 -i any (1)tcp: ip icmp arp rarp 和 tcp、udp、icmp这些选项等都要放到第一个参数的位置,用来过滤数据报的类型 (2)-i eth1 : 只抓经过接口eth1的包 (3)-t : 不显...

mskk
37分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部