文档章节

文字图片识别

strzb
 strzb
发布于 2017/03/02 14:39
字数 543
阅读 59
收藏 0
点赞 0
评论 0

前几天公司领导有个想法就是识别发票图片,将需要的内容识别出来。我之前并没有做过类似的工作,于是我就拿了一些发票仔细观察,发现了一些共同点,贴一张我下载的电子发票:

1、发票都有发票代码,发票号码。

2、发票都有二维码。

3、发票都是以表格形式给出,表格形式大同小异。

那就根据这几点可有以下解决方案可供参考:

1、发票可以使用发票代码和发票号码作为查询条件来查询票面信息。这种属于开放接口的方式,但是这些接口并不容易找到,或者获取这些接口的使用权并不容易。

2、识别二维码。我试过使用支付宝的扫码功能来识别发票上的二维码,从扫描结果上看,可能是因为地域差异二维码识别出来的信息格式并没有统一标准。贴个图片体会一下:

3、通过图片识别,这个需要技术。

调用接口和识别二维码我不多说了,这里主要说一下图片识别我所能想到的思路。说一下前提:我要识别的是电子发票,没有考虑字体模糊不清,打印重叠等问题。

首先要识别图片上的信息,肯定要对图片做处理。计划首先识别图片上的表格,再识别文字信息。

识别表格要用到opencv,

识别文字用Google的tesseract-ocr

这些只是我的一些想法,当然有很多不成熟甚至不对的地方。如有老司机请带带我啊。

© 著作权归作者所有

共有 人打赏支持
strzb
粉丝 0
博文 3
码字总数 2352
作品 0
程序员
图片文字识别SDK提供工作效率进入智能化办公必备OCR工具

  在日常的工作生活中有很多图片文字识别的需求,但是大多数人很少听说过文字识别的概念,有想要把图片、照片中文字输出却又想省掉这部分低效率的人工的企业,就是图片文字识别的需求者。例...

人工智能专家刘飞 ⋅ 2017/08/24 ⋅ 0

轻松将工作中的图片转换成word文档的方法

  古人云,事半功倍者乃真人也,事倍功半者乃小人也。这句话用在我们这些年轻人的身上是最好不过的了,不管做什么事只要能达到事半功倍就是非常成功的。   我是一名软文编辑人员,每天在...

华夏后裔 ⋅ 2017/04/11 ⋅ 0

The Best Image Ocr SDK For BAT.

The Best Image Ocr SDK For BAT. 百度 OCR 通用文字识别 通用文字识别(高精度版) 通用文字识别(含位置信息版) 通用文字识别(含位置高精度版) 通用文字识别(含生僻字版) 网络图片文字...

godruoyi ⋅ 2017/10/10 ⋅ 0

什么软件可以读取图片中的文字

我们大家是否会遇到很多图片,像图像数据一样头痛的格式,我们可以看到比较直观的东西,但是有一些是很难得到图像文件,我们可以用软件在任何一个文本中读取到文字吗?小编要说的就是这一点,...

魔瞳626 ⋅ 2017/03/16 ⋅ 1

ocr文字识别软件是做什么的?看过这篇文章你就会懂

  在日常工作中有一款常用的工具,不知道你是否知道,它是会将手机屏幕上的字符进行识别的工具,这个工具是现在广为流传的办公和学习,可能有一些朋友谁不知道自己使用的是否也是这款软件,...

华夏后裔 ⋅ 2017/04/14 ⋅ 0

洪柏利/BaiduOcr

BaiduOcr 使用PHP来接入百度文字识别来实现一些简单的功能 页面如下: 实现的功能有: 通用文字识别 通用文字识别(高精度) 网络图片文字识别 身份证识别 银行卡识别 驾驶证识别 行驶证识别...

洪柏利 ⋅ 01/17 ⋅ 0

捷速ocr文字识别软件如何将图片转换成word

  对于做编辑或者是资料整理的人员来说,最烦的莫过于整理图片文件了,这种图片格式的文件是最让人心烦的文件,不仅要依靠手打输入,更要命的是会大大降低我们的工作效率,这种做法是我们还...

华夏后裔 ⋅ 2017/04/19 ⋅ 0

【手写文字识别】-JavaAPI示例代码

手写文字识别-JavaAPI示例代码 不知不觉手写文字识别百度已经开始邀测了。需要的小伙伴去申请了哦。申请方式加入文字识别群找PM。或者工单提交申请。都要说明自己的APPID哦。 接口地址:http...

小帅帅丶 ⋅ 01/26 ⋅ 0

将扫描后的识别文字转换成word文件

  大家应该都在网站上下载过文件资料吧,那么大家就应该很清楚,一般网上下载的文件都是不可编辑的pdf文件或者是ppt文件,这些文件仅供我们在网站上进行浏览,而需要对这些文件进行编辑的话...

华夏后裔 ⋅ 2017/04/17 ⋅ 0

ABBYY图片文字识别技术可以用来做什么

图片文字识别软件ABBYY FineReader是现在办公室的必备软件,它可以识别JPG、GIF、PNG、BMP、TIF和PDF源文件、PDF扫描件,也就是说我们在日常工作中能够遇到的不能编辑的文字都可以通过ABBYY...

ABBYY ⋅ 2016/08/15 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

IOS-UI UI初步代码布局添加事件

ISO开发界面,UI是必须学习的一部分,其实很早之前想学来了,一直没有沉下心来学习。看到IOS的代码风格和布局就别扭的不行,跟java代码和android布局比较显得不是那么方便,所以一直到现在。...

京一 ⋅ 32分钟前 ⋅ 0

浅谈OpenDaylight的二次开发

OpenDaylight作为一款开源SDN网络控制器,依托于强大的社区支持以及功能特性,成为了目前主流的SDN网络控制器开发平台。在比较稳定的OpenDaylight Helium版本中,已经为开发者提供了大量的网...

wangxuwei ⋅ 41分钟前 ⋅ 0

API 开发中可选择传递 token 接口遇到的一个坑

在做 API 开发时,不可避免会涉及到登录验证,我使用的是jwt-auth 在登录中会经常遇到一个token过期的问题,在config/jwt.php默认设置中,这个过期时间是一个小时,不过为了安全也可以设置更...

等月人 ⋅ 42分钟前 ⋅ 0

Java NIO之文件处理

程序要操作本地操作系统的一个文件,可以分为以下三个部分: 对文件位置的操作 对文件的操作 对文件内容的操作 其中,对文件内容的操作在 Java NIO之Channel 中已经有了介绍,通过FileChann...

士别三日 ⋅ 46分钟前 ⋅ 0

Maven的pom.xml配置文件详解

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.......

小海bug ⋅ 今天 ⋅ 0

解决httpclient超时设置不生效的问题

最近公司有项目需要通过http调用第三方服务,且第三方服务偶有超时,故需要设置一定的超时时间防止不响应的情况出现。 初始设置如下: [java] view plain copy //超时设置 RequestConfig re...

Mr_Tea伯奕 ⋅ 今天 ⋅ 0

过滤器Filter和拦截器HandlerInterceptor

过滤器 依赖于servlet容器。在实现上基于函数回调,可以对几乎所有请求进行过滤,但是缺点是一个过滤器实例只能在容器初始化时调用一次。使用过滤器的目的是用来做一些过滤操作,获取我们想要...

hutaishi ⋅ 今天 ⋅ 0

Redis入门详解(转)

Redis入门详解 Redis简介 Redis安装 Redis配置 Redis数据类型 Redis功能 持久化 主从复制 事务支持 发布订阅 管道 虚拟内存 Redis性能 Redis部署 Redis应用场景 Redis总结 Redis简介: Redi...

xiaoyaoyoufang ⋅ 今天 ⋅ 0

说说javascript中的那些专业名词

DOM(Document Object Model) 文档对象模型 BOM(Browser Object Model) 浏览器对象模型 ECMA(European Computer Manufacturer's Association) 欧洲计算机制造商协会 W3C(World Wide Web Conso......

hang1989 ⋅ 今天 ⋅ 0

Bootstrap Wizard 多步表单控件

废话 有一块需求是 有多步表单 点击下一步时触发验证一个范围内的表单,点击上一步或取消,清空表单并返回第一步,点击最后一步提交整个表单的 就找到了这个插件,本来自己写了一个原生的 fo...

无极之岚 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部