文档章节

mac上Tesseract3.04.01_2样本训练

go4it
 go4it
发布于 2017/03/30 14:01
字数 224
阅读 120
收藏 0

##安装tesseract

brew uninstall tesseract
brew install --with-training-tools tesseract

##构建字符集

  • 合并为tif tools-Merge Tiff 保存为num.myfont.exp0.tif

  • 生成box

tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 batch.nochop makebox
  • 使用jTessBoxEditor修改box文件

  • 生产font_properties

echo myfont 0 0 0 0 0 >font_properties

  • 生成训练文件
tesseract num.myfont.exp0.tif num.myfont.exp0 -l eng -psm 7 nobatch box.train
  • 生成字符集文件
unicharset_extractor num.myfont.exp0.box
  • 生成shape
shapeclustering -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr
  • 聚合字符特征文件
mftraining -F font_properties -U unicharset -O myfont.unicharset num.myfont.exp0.tr

  • 正常化
cntraining num.myfont.exp0.tr
  • 合并训练文件
cp normproto myfont.normproto
cp inttemp myfont.inttemp
cp pffmtable myfont.pffmtable
cp unicharset myfont.unicharset
cp shapetable myfont.shapetable
combine_tessdata myfont.

##新增语言

brew list tesseract

查看tessdata位置

cp myfont.traineddata /usr/local/Cellar/tesseract/3.04.01_2/share/tessdata/
tesseract --list-langs

##测试

tesseract 9606.tif output -l myfont -psm 7

##doc

© 著作权归作者所有

go4it
粉丝 90
博文 1123
码字总数 1055633
作品 0
深圳
私信 提问
音频标签化3:igor-8m项目的训练、评估与测试

上一节介绍了youtube-8m项目,这个项目以youtube-8m dataset(简称8m-dataset)样本集为基础,进行训练、评估与测试。youtube-8m设计用于视频特征样本,但实际也适用于音频。另外,8m-datase...

小程2019
02/28
0
0
技术干货:用madlib学习『机器学习』之KNN

1. 前言 机器学习(ML)分为:监督学习,无监督学习,半监督学习等。 1.1 监督学习(supervised learning) 监督学习是训练神经网络和决策树的常见技术,高度依赖事先确定的分类系统给出的信...

DataHunter小数
2017/11/27
0
0
最新FB的一篇MultiGrain图像检索论文加code

原文链接:https://blog.csdn.net/qq34583607/article/details/87975350#1_9 《 MultiGrain: a unified image embedding for classes and instances》论文阅读笔记 主要亮点: (1)无论是用......

langb2014
08/15
0
0
安装google Tesseract,准备用golang写个图像识别的项目

环境: OS X EI Capitian Version 10.11.6 安装步骤参照: https://github.com/GeertJohan/go.tesseract/tree/v1 执行第二步时报错: Error: You must before tesseract can be installed 看......

有个地方叫作遥远
2016/08/25
1K
0
19- OpenCV+TensorFlow 入门人工智能图像处理-刷脸识别实现

章节介绍 实现一个刷脸识别 输入一张图片,找到图片中的人脸,识别这个是哪一个人。 案例代码简单 人工网络层级低。 隐层只有一层。 综合: 样本收集 + 图像预处理 + TensorFlow神经网络 pyth...

天涯明月笙
2018/05/19
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Qt编写自定义控件69-代码行数统计

一、前言 代码行数统计主要用来统计项目中的所有文件的代码行数,其中包括空行、注释行、代码行,可以指定过滤拓展名,比如只想统计.cpp的文件,也可以指定文件或者指定目录进行统计。写完这...

飞扬青云
17分钟前
3
0
驰骋工作流引擎-ccflow关于 “ 是否自动计算未来的处理人”的功能变更

关键字:流程未来节点处理人 工作流快速开发平台 工作流流设计 业务流程管理 asp.net 开源工作流 业务背景:一个流程在启动起来后,是可以对一些节点计算出来处理人是谁,流程的走向。对于另...

孟娟
33分钟前
4
0
IT兄弟连 HTML5教程 HTML5表单 HTML表单设计1

表单是PHP程序中最常使用的收集站点访问者信息的数据输入界面。通过表单浏览器获取用户的输入数据,并传送给Web服务器的脚本程序中,以各种不同的方式进行处理。在表单中提供了多种输入方式,...

老码农的一亩三分地
34分钟前
4
0
武者Vue

本文转载于:专业的前端网站➼武者Vue 1 - Introduction2 - The Vue Instance3 - Data & Methods4 - Data Binding5 - Events6 - Event Modifiers7 - Keyboard Events8 - Two-Way Data......

前端老手
40分钟前
6
0
uni app 零基础小白到项目实战

$emit 子组件传给父组件$ref 父组件操作子组件 公用模板 uni-app全局变量的几种实现方法 const websiteUrl = 'http'const now = Date.now || function() { return new Date().getTime......

达达前端小酒馆
50分钟前
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部