文档章节

opencv+python机读卡识别(四)百度API进行数字识别

Digimon
 Digimon
发布于 2017/07/09 19:27
字数 570
阅读 442
收藏 9
点赞 1
评论 0

第一部分预处理:https://my.oschina.net/u/3268732/blog/1236298

第二部分图像切割:https://my.oschina.net/u/3268732/blog/1236344

第三部分选择题识别:https://my.oschina.net/u/3268732/blog/1237819

1.对数字图像部分进行处理 预处理部分同样需要,步骤与选择题模块相似,但目的不同,文字部分主要将数字变粗,便于识别。其实也就是和选择题模块相比变了几个参数

NumImg=cv2.blur(thresh,(15,15))
NumImg=cv2.threshold(NumImg, 170, 255, cv2.THRESH_BINARY)[1]

数字部分预处理

2.调用百度ocr api 试过多种检测方式,还是用别人家现成的好http://apistore.baidu.com/ 百度api使用方法: 首先需要注册一个百度云账号,这样在个人中心里就会看到apikey。这个就是和百度进行交流的钥匙。然后找到百度ocr的入口找到接口地址。虽然这里给出了但还是可以看下文档,里面有些细节,比如图片想免费就要300k以内。上面给的python示例代码是py2的,这里给出py3的方式(http://apis.baidu.com/idl_baidu/baiduocrpay/idlocrpaid)

import sys, urllib, json
import urllib.request
import urllib.parse
import base64
url = 'http://apis.baidu.com/idl_baidu/ocridcard/ocridcard'

data = {}
data['fromdevice'] = "pc"
data['clientip'] = "10.10.10.0"
data['detecttype'] = "LocateRecognize"
data['languagetype'] = "ENG"#英文模式
data['imagetype'] = "1"
#图片在本地

file_object = open('T.png','rb')
try:
     img = file_object.read( )
finally:
     file_object.close( )
data['image'] =base64.b64encode(img)


decoded_data = urllib.parse.urlencode(data)
decoded_data = decoded_data.encode('utf-8')

req = urllib.request.Request(url,decoded_data)

req.add_header("Content-Type", "application/x-www-form-urlencoded")
req.add_header("apikey", "这里填入个人中心的apikey") 

resp = urllib.request.urlopen(req)
content = resp.read()
if(content):
    content = json.loads(content.decode())
    print(content)

3.切割图片 根据具体情况需要切割图片才能让百度api识别,具体限制因素还是图片大小,切割方式,这里只给出示例

#切割具体位置[起始y:终止y,起始x:终止y]
tempimg1=img[240:461,213:939]
#图片切割,width,height分别填入目标宽高
tempimg1 = cv2.resize(tempimg1, (width, height), cv2.INTER_LANCZOS4)
#图片保存,png,jpg格式均可
 cv2.imwrite("T.png", tempimg1)

之后调用,若识别为英文需要转化,比如可能将0识别为D,这时转换即可,如:

def temp(char):
    if(char=='D'):
        return '0'

效果如图展示 数字识别样例 当然若是能想办法去掉答题卡外围边框效果应该会更好……

© 著作权归作者所有

共有 人打赏支持
Digimon
粉丝 40
博文 17
码字总数 14810
作品 0
成都
程序员
北京中安未来电子护照阅读器(最新版本)

一、产品描述: 北京中安未来电子护照阅读器是一款外形轻巧美观的证件识读设备,它配备高清500万像素成像系统,采用TH-OCR技术可识别多种身份证件。可识读符合国际民航组织ICAO DOC 9303标准...

wenzuoyong123 ⋅ 04/23 ⋅ 0

关于机器识别或图像识别的问题求助?

把机读卡扫描成图片,通过对图片的处理,得到学生的得分。尽管有现成的机读卡,但是这个卡是定制的,所以只有通过自己做识别了,但是还没有思路,求大家集思广益。

小昭归来 ⋅ 2017/02/17 ⋅ 2

AI开发者们 百度开放这些技术与资源吸引你

主题为“Create with AI”的百度AI开发者实战营自10月19日启动以来,为全国各地开发者、创业者和合作伙伴带来语音、图像、人脸、UNIT、AR、PaddlePaddle等百度最核心的AI技术能力支持。 自历...

吕倩 ⋅ 2017/12/08 ⋅ 0

人工智能的黎明:混战中的语音识别

情感合成、远场方案、唤醒二期技术和长语音方案……这些听起来有些陌生的技术,未来将可能改变我们的生活。 语音技术作为人机交互方式的入口,是人工智能重要的一环。不只是BAT,搜狗、科大讯...

行者武松 ⋅ 03/08 ⋅ 0

共享代码总结。。。做个备份,有时间再写一写心得

Verilog /Xilinx 五级流水CPU代码 http://www.oschina.net/code/snippet178268446324 Verilog VGAhttp://www.oschina.net/code/snippet178268446319 BP网络进行手写数字识别 http://www.osc......

猜猜我是吧 ⋅ 2015/03/14 ⋅ 0

手写数字识别(一)(KNN+CNN+tensorflow)

手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值,在大数据时代的背景下,其应用领域非常之广。很多学者对手写数字识别提出了不同的算法,取得了不错的测试效果,但如今O...

wlx19970505 ⋅ 05/10 ⋅ 0

主题:人脸检测原理及示例(OpenCV+Python)

发表时间:2009-09-06 < > 猎头职位: 北京: ITeye网站诚聘社区编辑 OpenCV库的简介 OpenCV+Ruby构建图像处理研究平台 python django opencv 脸部识别的小游戏 更多相关推荐 Python 前言 关于...

晨曦之光 ⋅ 2012/05/28 ⋅ 0

G20峰会 人脸识别三大技术--广州颜鉴信息科技

2016年百度世界大会开幕,其百度创始人李彦宏在会上发表了“人工智能”为主题的演讲,并推出最新产品“百度大脑”让参展人员眼前一亮,其图像识别能力非常突出,人脸识别概率已经高达97%;G...

colorreco ⋅ 2016/09/12 ⋅ 0

基于Emgu CV+百度人脸识别,实现视频动态 人脸抓取与识别

背景 目前AI 处于风口浪尖,作为 公司的CTO,也作为自己的技术专研,开始了AI之旅,在朋友圈中也咨询 一些大牛对于AI 机器学习框架的看法,目前自己的研究方向主要开源的 AI 库,如:Emgu CV...

sd7o95o ⋅ 2017/12/09 ⋅ 0

python实现明星专家系统

其实一直对电影里面的对犯人进行人脸匹配然后,刷出来犯人信息很感兴趣,今天晚上一时兴起,就搞了一把小的。 理论上:你可以建立一个你感兴趣的百万级的数据库,给你个照片 ,你就可以得到她...

付炜超 ⋅ 2017/08/21 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

HiSDP —— 高效的C++软件开发平台

目前阿里集团每天有近1000PB的数据是通过LogAgent采集的,为了让LogAgent做到资源占用节省和高效采集,背后是基于HiSDP去构建的。 缘由 当决定采用C++编程语言去开发一个软件时,紧接着所面临...

阿里云云栖社区 ⋅ 27分钟前 ⋅ 0

zookeeper-3.4.12 下载与安装教程

一、zookeeper下载地址 http://mirrors.hust.edu.cn/apache/zookeeper/ 二、启动教程 把压缩包放在指定目录下 第三: 进入 conf文件夹底下 zoo_sample.cfg 文件名改成 zoo.cfg 第四步: 进入b...

泉天下 ⋅ 28分钟前 ⋅ 0

Oracle 中文日期转换

SELECT TO_date('2011年11月11日', 'yy"年"mm"月"dd"日"') FROM DUAL; 1. Oracle无法识别中文格式,所以添加双引号。 2. 后面的格式是指字符串在转换前的格式,而不是指转换后的格式。...

江戸川 ⋅ 30分钟前 ⋅ 0

MySell:API Spring Boot

起步 类目 商品 订单

BeanHo ⋅ 32分钟前 ⋅ 0

Spring方法拦截器MethodInterceptor

参考资料 1、Spring方法拦截器MethodInterceptor 2、Sharding JDBC源码分析-JdbcMethodInvocation类的作用

哎小艾 ⋅ 36分钟前 ⋅ 0

正则表达式

元字符 元字符,又叫字符集,就是用一些特殊符号表示特定种类的字符或位置。 匹配字符 . 匹配除换行符以外的任意字符 \w 匹配字母或数字或下划线或汉字 \s 匹配任意的空白符 \d 匹配数字 匹配...

wangchen1999 ⋅ 36分钟前 ⋅ 0

数据库数据导入Elasticsearch案例分享

基于bboss持久层和bboss elasticsearch客户端实现数据库数据导入es案例分享(支持各种数据库和各种es版本) 1.案例对应的源码 https://gitee.com/bboss/bboss-elastic/blob/master/bboss-el...

bboss ⋅ 36分钟前 ⋅ 0

动手---sbt(2)

参考 https://blog.csdn.net/leishangwen/article/details/46225587 建立一个chisel_max目录,文件内容如后面所述,现在开始执行命令: joe@joe-Aspire-Z3730:/media/sdb4/download/scala$ c......

whoisliang ⋅ 43分钟前 ⋅ 0

纯js实现最简单的文件上传(后台使用MultipartFile)

<!DOCTYPE html><html><head> <meta charset="UTF-8"> <title>XMLHttpRequest上传文件</title> <script type="text/javascript"> //图片上传 var xhr......

孟飞阳 ⋅ 48分钟前 ⋅ 0

iOS宇宙大战游戏、调试工具、各种动画、AR相册、相机图片编辑等源码

iOS精选源码 日期时间选择器,swift Space Battle 宇宙大战 SpriteKit游戏源码 LLDebugTool - 便捷的IOS调试工具(新增截屏功能) 相机扫描or长按识别二维码、FMDB、键盘动态高度、定位等 动画...

sunnyaigd ⋅ 49分钟前 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部