文档章节

Java 图像智能字符识别技术——【专题三】

侠客人生
 侠客人生
发布于 2017/07/27 21:01
字数 747
阅读 55
收藏 1

        对于图像智能字符识别时,我们处理的时候单纯的使用一种算法去识别时识别率是非常低的。而实际上企业或真实项目中的图片都是做过各种处理的,在这种情况下我们单纯的使用一种方法,显得过于苍白。我们在专题一种讲到的图片识别前的准备工作还有很多,只用专题二中的【二值化】、【噪声消除】还远远不够,这节我们看一下【倾斜较正】和【字符切割】处理。

    字符切割

       给大家几个例子还拿某互联网公司的电话号码来说,他们选择了红色,而且图片的举例明显离得很近,这样的话明显给识别带来了难度(红色在调整阀值时反差不够明显,文字间距小识别就容易出错),对这种我们可以采用字符切分,按照一定比例去切分图片(该方法适用性不是很强,需要先找到图片的规律,而且切割时容易切割错位。那为什么还要讲,毕竟也是一种方法,在一些特殊情况这种方法还是很有效果的),切分后给各个图片编号。使用其他算法按照顺序单个处理即可。

eg:

                                                      图    一

 

                                                      图    二

可能图一我们按照一定的比例去切割在识别的时候还是没有问题的。对于图二我们按照一定比例切割时,上面提到的问题将都会出现。对于第二张图需要说一下图中绿色部分,白色是原图的底色,在分隔的时候就像图二一样在最后一次分隔时原图片剩余部分不够分隔比例时,这种图在分隔之前需要在原图上补充扩展底图,让其宽度是分割比例的倍数。这样可防止切割时最后一张图不切割的问题。

        这是使用物理切割的方法区识别,还有一些更高明的分隔算法eg:投影分隔、颜色聚类等分隔算法。有兴趣的朋友可以再去研究此类算法,再次就不赘述了。

 

    倾斜较正

     在实际项目中如名片识别系统、身份证识别系统、车管系统等都会用到图片识别技术,而车管系统中对车牌照的识别,可能拍摄的角度、司机对车牌照悬挂的方式都有可能产生倾斜,倾斜图片对于图片识别影响很大,对于倾斜矫正有很多现成的方法,如Hough、OpenCV等技术都能实现。

    Hough

       Hough变换可用于一般文档图像的倾斜校正。

    OpenCV

       OpenCV实现基于傅里叶变换的旋转文本校正 

© 著作权归作者所有

共有 人打赏支持
侠客人生
粉丝 15
博文 43
码字总数 82954
作品 0
朝阳
如何以Java实现网页截图技术

今天看到某网友关于“如何以Java实现网页截图技术”的咨询帖,由于出现该咨询的地点非常不适合较长回复,故以博文形式回答。 事实上,如果您想以Java实现网页截图,也就是“输入一段网址,几...

Carl_
2015/03/03
0
7
北京、杭州随你选!阿里安全实验室招聘各种技术人才

图灵实验室 图灵实验室是阿里巴巴集团安全部旗下的顶级人工智能研发团队,专注于计算机视觉、自然语言处理、机器学习和深度学习图等领域的技术研发,依托多年积累的技术经验,通过云+端的产品...

华蒙
04/13
0
0
腾讯 AI-Java 客户端 Taip 重大更新,所有接口均已接入

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前版本已经更新至4.2.1,Java开发者们无需再各种百度了。 Java JDK 1.7+ Maven引入 cn.x...

小帅帅丶
05/22
0
45
腾讯 AI-Java 客户端 TAip 4.3.2 发布,增加关键词检索

TAIP 是调用腾讯 AI 接口的 Java 客户端,为调用腾讯 AI 功能的开发人员提供了一系列的交互方法。 目前版本已经更新至4.3.2,Java开发者们无需再各种百度了。 新特性 增加关键词检索接口 优图...

小帅帅丶
07/09
0
0
ABBYY FineReader Engineocr文字识别软件详细介绍及下载

ABBYY FineReader Engine用于开发ocr文字识别软件和图片识别软件,提供自己的OCR API, 包括光学字符识别(OCR)、智能字符识别(ICR)、光标识别(OMR)、光学条码识别(OBR)、文档图片、P...

javascript1
2014/08/25
0
0

没有更多内容

加载失败,请刷新页面

加载更多

linux运维人员必会运维工具

linux运维人员必会开源运维工具体系 说明:不同的技术人员,不同的阶段确定知识边界非常重要,否则,就像马拉车,不知道终点在哪,累死也达不到目标。例如拿8K要学多少,拿15K要学多少。一个...

寰宇01
17分钟前
2
0
10大PHP比特币开源项目

如果你是一个Phper,如果你希望学习区块链,那么本文列出的 10个开源的Php比特币项目,将有助于你了解在自己的应用中 如何加入对比特币的支持。 如果你希望快速掌握使用Php对接比特币钱包的方...

汇智网教程
37分钟前
1
0
springclould feign客户端添加全局参数

用springclould feign作为调用服务的客户端,一般来说参数可以写在feignclient的方法参数里 有时需要所有feign请求都统一添加一些参数,例如token用于鉴权等,可以这样做: 添加一个配置类,...

canneljls
38分钟前
1
0
win32截屏并rgb24转yuv420

//最终f的内存布局为BGRA格式,需要保证buf长度足够(>w*h*4)void ScreenCap(void* buf, int w, int h){ HWND hDesk = GetDesktopWindow(); HDC hScreen = GetDC(hDesk); ......

styleman
今天
1
0
php输出mysql取出的中文为??的问题

解决方法: @ $db=new mysqli(DB_HOST,DB_USER,DB_PASSWORD,DB_DB); $db->query("set names utf8");//添加此语句,可以解决问题...

Aomo
今天
1
2

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部