文档章节

文字图片识别

strzb
 strzb
发布于 2017/03/02 14:39
字数 543
阅读 70
收藏 0

前几天公司领导有个想法就是识别发票图片,将需要的内容识别出来。我之前并没有做过类似的工作,于是我就拿了一些发票仔细观察,发现了一些共同点,贴一张我下载的电子发票:

1、发票都有发票代码,发票号码。

2、发票都有二维码。

3、发票都是以表格形式给出,表格形式大同小异。

那就根据这几点可有以下解决方案可供参考:

1、发票可以使用发票代码和发票号码作为查询条件来查询票面信息。这种属于开放接口的方式,但是这些接口并不容易找到,或者获取这些接口的使用权并不容易。

2、识别二维码。我试过使用支付宝的扫码功能来识别发票上的二维码,从扫描结果上看,可能是因为地域差异二维码识别出来的信息格式并没有统一标准。贴个图片体会一下:

3、通过图片识别,这个需要技术。

调用接口和识别二维码我不多说了,这里主要说一下图片识别我所能想到的思路。说一下前提:我要识别的是电子发票,没有考虑字体模糊不清,打印重叠等问题。

首先要识别图片上的信息,肯定要对图片做处理。计划首先识别图片上的表格,再识别文字信息。

识别表格要用到opencv,

识别文字用Google的tesseract-ocr

这些只是我的一些想法,当然有很多不成熟甚至不对的地方。如有老司机请带带我啊。

© 著作权归作者所有

共有 人打赏支持
上一篇: JSON解析(一)
下一篇: json解析(二)
strzb
粉丝 0
博文 3
码字总数 2352
作品 0
程序员
私信 提问
图片文字识别SDK提供工作效率进入智能化办公必备OCR工具

  在日常的工作生活中有很多图片文字识别的需求,但是大多数人很少听说过文字识别的概念,有想要把图片、照片中文字输出却又想省掉这部分低效率的人工的企业,就是图片文字识别的需求者。例...

人工智能专家刘飞
2017/08/24
0
0
轻松将工作中的图片转换成word文档的方法

  古人云,事半功倍者乃真人也,事倍功半者乃小人也。这句话用在我们这些年轻人的身上是最好不过的了,不管做什么事只要能达到事半功倍就是非常成功的。   我是一名软文编辑人员,每天在...

华夏后裔
2017/04/11
452
0
The Best Image Ocr SDK For BAT.

The Best Image Ocr SDK For BAT. 百度 OCR 通用文字识别 通用文字识别(高精度版) 通用文字识别(含位置信息版) 通用文字识别(含位置高精度版) 通用文字识别(含生僻字版) 网络图片文字...

godruoyi
2017/10/10
0
0
洪柏利/BaiduOcr

BaiduOcr 使用PHP来接入百度文字识别来实现一些简单的功能 页面如下: 实现的功能有: 通用文字识别 通用文字识别(高精度) 网络图片文字识别 身份证识别 银行卡识别 驾驶证识别 行驶证识别...

洪柏利
2018/01/17
0
0
ocr文字识别软件是做什么的?看过这篇文章你就会懂

  在日常工作中有一款常用的工具,不知道你是否知道,它是会将手机屏幕上的字符进行识别的工具,这个工具是现在广为流传的办公和学习,可能有一些朋友谁不知道自己使用的是否也是这款软件,...

华夏后裔
2017/04/14
38
0

没有更多内容

加载失败,请刷新页面

加载更多

cnetos7+docker+rancher构建基于DevOps的全自动CI【01】

来自DevOps实践分享,分享从开发代码到生产环境部署的一条龙操作的实践及经验, 包含工具技术的选型及考量、私有代码库与私有镜像库的应用等。 1、环境选择 安装Rancher环境,一定要在干净的...

Elson
27分钟前
1
0
21分钟教会你分析MaxCompute账单

背景 阿里云大计算服务MaxCompute是一款商业化的大数据分析平台,其计算资源有预付费和后付费两种计费方式。并且产品每天按照project为维度进行计量计费(账单基本情况下会第二天6点前产出)...

zhaowei121
31分钟前
0
0
CTO职场解惑指南系列(一)

基于科技能够改变世界的事实,几乎每个公司的程序员都自带闪光灯。程序员的手和普通人的手自然是有区别的,“我们可是用双手改变了世界” 。(码农真的是靠双手吃饭,呵呵) 这个世界上但凡靠...

阿里云云栖社区
35分钟前
3
0
css实现图片自适应容器宽高

css实现图片自适应容器宽高的做法一般如下所示 <style>div{width: 200px; height: 200px}div img{width: 100%; height: 100%}</style><div><img src="xxxx.png" /></div> 当外层容......

小草先森
35分钟前
3
0
PlatON在CentOS上编译部署

本文作者为万向区块链CTO罗荣阁。 目录 PlatON在CentOS上编译部署 1. CentOS 环境准备 1.1. 使用rpm 安装devtoolset-7 1.2. 使用rpm 安装dos2unix 1.3. 准备PlatON代码 1.4. 确保build脚本正...

万向区块链
43分钟前
10
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部