文档章节

验证码cnn模型

pseudo
 pseudo
发布于 2017/06/25 09:26
字数 538
阅读 100
收藏 0
"""基于切割的识别模型"""

import numpy as np
from PIL import Image
from keras import backend as K
from keras import layers
from keras.models import Sequential

from . import img_util

K.set_image_dim_ordering('tf')

img_width, img_height = 50, 70
chars = "23456789abcdefghiklmnpqrstuvwxyz"


class ZXRModel:
    def __init__(self):
        raise NotImplemented

    def inspect(self, file):
        from keras.utils import plot_model
        plot_model(self.model, to_file=file, show_shapes=True)

    def load_weights(self, weight_filepath):
        self.model.load_weights(weight_filepath)

    def predict(self, img: Image.Image):
        data = self.load_img(img)
        indices = self.model.predict_classes(np.asarray(data), batch_size=len(data), verbose=0)
        return [chars[i] for i in indices]

    def train(self, glob_img_path, save_weights_to=None):
        data, label = self._load_data(glob_img_path)
        self._train_with_data(data, label)
        if save_weights_to:
            self.model.save_weights(save_weights_to)

    def _load_data(self, glob_path):
        from glob import iglob
        from os import path

        img_files = iglob(glob_path)

        print('开始加载训练集:', glob_path)
        data, label = list(), list()
        for file in img_files:
            file_name = path.splitext(path.split(file)[-1])[0].split('.')[0].lower()
            try:
                t = self.load_img(Image.open(file))
                if len(file_name) == len(t):
                    data += t
            except Exception as ex:
                from sys import stderr
                print(ex.args[0], file=stderr)
                continue
            else:
                label += [chars.index(i) for i in file_name]
        return data, label

    def train_with_data(self, data, labels):
        from keras.utils import np_utils
        print('训练集: %d, label: %d' % (len(data), len(labels)))
        self.model.compile(loss='categorical_crossentropy', optimizer='adadelta', metrics=['accuracy'])
        self.model.fit(np.asarray(data),
                       np_utils.to_categorical(labels, len(chars)),
                       batch_size=500, epochs=150, shuffle=True,
                       verbose=1)

    def load_img(self, img):
        segs = img_util.split_zxr(img if img.mode == 'RGB' else img.convert('RGB'))
        return [255 - np.asarray(seg, dtype='int32') for seg in segs]


class SimpleModel(ZXRModel):
    def __init__(self):
        """
        vggnet简化版
        """
        _model = Sequential()
        _model.add(layers.InputLayer(input_shape=(img_height, img_width, 1)))
        for i in range(2):
            _model.add(layers.Convolution2D(9 * 3 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.Convolution2D(9 * 3 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.MaxPooling2D((2, 2)))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(output_dim=128, activation='tanh'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model


class VGGModel(ZXRModel):
    def __init__(self, training=False):
        """定制的vggnet模型"""
        drop_rate = 0.5 if training else 1.0
        _model = Sequential()
        _model.add(layers.InputLayer(input_shape=(img_height, img_width, 3)))
        for i in range(1, 3):
            _model.add(layers.Convolution2D(16 * 2 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.Convolution2D(16 * 2 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.MaxPooling2D((2, 2), strides=(2, 2)))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(1024, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(1024, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(output_dim=256, activation='relu'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model


class AlexNet(ZXRModel):
    def __init__(self, training=False):
        drop_rate = 0.5 if training else 1.0
        _model = Sequential()
        _model.add(layers.InputLayer((img_height, img_width, 3)))
        _model.add(layers.Convolution2D(16, (5, 5), strides=(2, 2), activation='relu'))
        _model.add(layers.MaxPool2D((2, 2), strides=(2, 2)))
        _model.add(layers.Convolution2D(32, (3, 3), strides=(1, 1), activation='relu'))
        _model.add(layers.MaxPool2D((2, 2), strides=(2, 2)))

        # for _ in range(3):
        _model.add(layers.Convolution2D(96, (2, 2), strides=(1, 1), activation='relu'))
        # _model.add(layers.Convolution2D(64, (3, 3), strides=(1, 1), activation='relu'))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(512, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(512, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(output_dim=256, activation='relu'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model

© 著作权归作者所有

共有 人打赏支持
pseudo

pseudo

粉丝 79
博文 37
码字总数 35469
作品 3
朝阳
程序员
加载中

评论(2)

zyj789
zyj789
麻烦问下:您代码中的from . import img_util 引入的 img_util 是你自己写的吗?如果是的话,能否把代码贴下!谢谢!!!
zyj789
zyj789
麻烦问下:from . import img_util 引入的 img_util 是你自己写的吗?如果是的话,能否把代码贴下!谢谢!!!
tensorflow 实现端到端的OCR:二代身份证号识别

最近在研究OCR识别相关的东西,最终目标是能识别身份证上的所有中文汉字+数字,不过本文先设定一个小目标,先识别定长为18的身份证号,当然本文的思路也是可以复用来识别定长的验证码识别的。...

某杰
2017/08/08
0
0
裤҉裆҉里҉的҉霸҉气҉/verification-decoder

四位验证码CNN识别 1.参考 [1] 街道多位数字CNN识别,神经网络架构参考 [2] 关于CNN的详细解释,深度学习入门必备 [3] 验证码生成参考类 2.支持 [1] Python3.6.1 or >=3.5 [2] TensorFlow 1....

裤҉裆҉里҉的҉霸҉气҉
2017/11/28
0
0
CNN破解简单验证码(Tensorflow实现)

使用CNN破解一下自己生成的图片验证码,因为电脑性能不行,只破解四位的数字验证码,代码实现中可以对符号、字符和数字混合的验证码进行破解,原理相同,有高性能GPU的童鞋可以试试玩玩。CNN...

cskywit
02/01
0
0
福音:不懂代码也能用TensorFlow做验证码识别了

长话短说,开门见山,网络上现有的代码以教学研究为主,对于验证码识别有刚需的朋友们,无需阅读代码,几个参数任何人都能使用机器学习技术训练一个模型,如本文有不严谨之处还请告知与谅解,...

edelweiss
08/06
0
0
ADDA模型实现

去年有看了几篇domain adaptation相关的论文,这里想实现一篇最简单好用的模型,Adversarial Discriminative Domain Adaptation,作者提出了针对adversrarial adaptation 的一个通用框架,并...

Slyne_D
01/21
0
0

没有更多内容

加载失败,请刷新页面

加载更多

如何通过 J2Cache 实现分布式 session 存储

做 Java Web 开发的人多数都会需要使用到 session (会话),我们使用 session 来保存一些需要在两个不同的请求之间共享数据。一般 Java 的 Web 容器像 Tomcat、Resin、Jetty 等等,它们会在...

红薯
41分钟前
1
0
C++ std::thread

C++11提供了std::thread类来表示一个多线程对象。 1,首先介绍一下std::this_thread命名空间: (1)std::this_thread::get_id():返回当前线程id (2)std::this_thread::yield():用户接口...

yepanl
今天
2
0
Nignx缓存文件与动态文件自动均衡的配置

下面这段nginx的配置脚本的作用是,自动判断是否存在缓存文件,如果有优先输出缓存文件,不经过php,如果没有,则回到php去处理,同时生成缓存文件。 PHP框架是ThinkPHP,最后一个rewrite有关...

swingcoder
今天
1
0
20180920 usermod命令与用户密码管理

命令 usermod usermod 命令的选项和 useradd 差不多。 一个用户可以属于多个组,但是gid只有一个;除了gid,其他的组(groups)叫做扩展组。 usermod -u 1010 username # 更改用户idusermod ...

野雪球
今天
1
0
Java网络编程基础

1. 简单了解网络通信协议TCP/IP网络模型相关名词 应用层(HTTP,FTP,DNS等) 传输层(TCP,UDP) 网络层(IP,ICMP等) 链路层(驱动程序,接口等) 链路层:用于定义物理传输通道,通常是对...

江左煤郎
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部