文档章节

Java 图像智能字符识别技术——【专题三】

侠客人生
 侠客人生
发布于 2017/07/27 21:01
字数 747
阅读 83
收藏 1

        对于图像智能字符识别时,我们处理的时候单纯的使用一种算法去识别时识别率是非常低的。而实际上企业或真实项目中的图片都是做过各种处理的,在这种情况下我们单纯的使用一种方法,显得过于苍白。我们在专题一种讲到的图片识别前的准备工作还有很多,只用专题二中的【二值化】、【噪声消除】还远远不够,这节我们看一下【倾斜较正】和【字符切割】处理。

    字符切割

       给大家几个例子还拿某互联网公司的电话号码来说,他们选择了红色,而且图片的举例明显离得很近,这样的话明显给识别带来了难度(红色在调整阀值时反差不够明显,文字间距小识别就容易出错),对这种我们可以采用字符切分,按照一定比例去切分图片(该方法适用性不是很强,需要先找到图片的规律,而且切割时容易切割错位。那为什么还要讲,毕竟也是一种方法,在一些特殊情况这种方法还是很有效果的),切分后给各个图片编号。使用其他算法按照顺序单个处理即可。

eg:

                                                      图    一

 

                                                      图    二

可能图一我们按照一定的比例去切割在识别的时候还是没有问题的。对于图二我们按照一定比例切割时,上面提到的问题将都会出现。对于第二张图需要说一下图中绿色部分,白色是原图的底色,在分隔的时候就像图二一样在最后一次分隔时原图片剩余部分不够分隔比例时,这种图在分隔之前需要在原图上补充扩展底图,让其宽度是分割比例的倍数。这样可防止切割时最后一张图不切割的问题。

        这是使用物理切割的方法区识别,还有一些更高明的分隔算法eg:投影分隔、颜色聚类等分隔算法。有兴趣的朋友可以再去研究此类算法,再次就不赘述了。

 

    倾斜较正

     在实际项目中如名片识别系统、身份证识别系统、车管系统等都会用到图片识别技术,而车管系统中对车牌照的识别,可能拍摄的角度、司机对车牌照悬挂的方式都有可能产生倾斜,倾斜图片对于图片识别影响很大,对于倾斜矫正有很多现成的方法,如Hough、OpenCV等技术都能实现。

    Hough

       Hough变换可用于一般文档图像的倾斜校正。

    OpenCV

       OpenCV实现基于傅里叶变换的旋转文本校正 

© 著作权归作者所有

共有 人打赏支持
侠客人生
粉丝 15
博文 43
码字总数 82954
作品 0
朝阳
私信 提问
12月21日云栖精选夜读 | 推荐:一款分布式的对象存储服务

最近公司在准备内部数据上云,并且内部数据库每天的数据量很大,需要采用大数据存储的方案。 方案调研每个程序技术在实现之前,需要进行开源产品的调研,适合自己产品的技术方案才是最好的。...

yq传送门
2018/12/21
0
0
如何以Java实现网页截图技术

今天看到某网友关于“如何以Java实现网页截图技术”的咨询帖,由于出现该咨询的地点非常不适合较长回复,故以博文形式回答。 事实上,如果您想以Java实现网页截图,也就是“输入一段网址,几...

Carl_
2015/03/03
0
7
ABBYY FineReader Engineocr文字识别软件详细介绍及下载

ABBYY FineReader Engine用于开发ocr文字识别软件和图片识别软件,提供自己的OCR API, 包括光学字符识别(OCR)、智能字符识别(ICR)、光标识别(OMR)、光学条码识别(OBR)、文档图片、P...

javascript1
2014/08/25
0
0
OSChina 技术周刊第二期

每周技术抢先看,总有你想要的! 移动开发 【软件】Google Android 官方培训课程中文版 【博客】iOS开发之Swift调用Objective-C代码 【博客】教你爱上Blocks(闭包)(iOS) 【博客】uick-co...

OSC编辑部
2014/09/28
12.1K
34
JAVA基础再回首(三十)——JAVA基础再回首完美结束,感概万千!

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/m366917/article/details/52724939 JAVA基础再回首(三十)——JAVA基础再回首完美结束,感概万千! 经过了几...

Aduroidpc
2016/10/02
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周日乱弹 —— 没时间 没头发 但有钱

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @开源中国总经办主任 :分享齐一的单曲《这个年纪》 《这个年纪》- 齐一 手机党少年们想听歌,请使劲儿戳(这里) @肿肿卷 :我真的可以睡一天...

小小编辑
20分钟前
8
2
Django进阶 1.1 ORM基础—ORM 1.2.1 增删改查之查询 1.2.2 删改增 (1) 1.2.3 删改增 (2)

ORM基础 ORM是Django操作数据库的API,Django的作者将sql语句封装在里面供我们使用。 我们前面还提到过Django提供一个模拟数据库的工具,sqlite,供我们学习测试使用。 如果我们想使用mysql...

隐匿的蚂蚁
今天
3
0
Windows 上安装 Scala

在安装 Scala 之前需要先安装 Java 环境,具体安装的详细方法就不在这里描述了。 您可以自行搜索我们网站中的内容获得其他网站的帮助来获得如何安装 Java 环境的方法。 接下来,我们可以从 ...

honeymose
今天
3
0
数据库篇多表操作

第1章 多表操作 实际开发中,一个项目通常需要很多张表才能完成。例如:一个商城项目就需要分类表(category)、商品表(products)、订单表(orders)等多张表。且这些表的数据之间存在一定的关系...

stars永恒
今天
3
0
nginx日志自动切割

1.日志配置(Nginx 日志) access.log----记录哪些用户,哪些页面以及用户浏览器,IP等访问信息;error.log------记录服务器错误的日志 #配置日志存储路径:location / {      a...

em_aaron
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部