文档章节

验证码cnn模型

pseudo
 pseudo
发布于 2017/06/25 09:26
字数 538
阅读 105
收藏 0
"""基于切割的识别模型"""

import numpy as np
from PIL import Image
from keras import backend as K
from keras import layers
from keras.models import Sequential

from . import img_util

K.set_image_dim_ordering('tf')

img_width, img_height = 50, 70
chars = "23456789abcdefghiklmnpqrstuvwxyz"


class ZXRModel:
    def __init__(self):
        raise NotImplemented

    def inspect(self, file):
        from keras.utils import plot_model
        plot_model(self.model, to_file=file, show_shapes=True)

    def load_weights(self, weight_filepath):
        self.model.load_weights(weight_filepath)

    def predict(self, img: Image.Image):
        data = self.load_img(img)
        indices = self.model.predict_classes(np.asarray(data), batch_size=len(data), verbose=0)
        return [chars[i] for i in indices]

    def train(self, glob_img_path, save_weights_to=None):
        data, label = self._load_data(glob_img_path)
        self._train_with_data(data, label)
        if save_weights_to:
            self.model.save_weights(save_weights_to)

    def _load_data(self, glob_path):
        from glob import iglob
        from os import path

        img_files = iglob(glob_path)

        print('开始加载训练集:', glob_path)
        data, label = list(), list()
        for file in img_files:
            file_name = path.splitext(path.split(file)[-1])[0].split('.')[0].lower()
            try:
                t = self.load_img(Image.open(file))
                if len(file_name) == len(t):
                    data += t
            except Exception as ex:
                from sys import stderr
                print(ex.args[0], file=stderr)
                continue
            else:
                label += [chars.index(i) for i in file_name]
        return data, label

    def train_with_data(self, data, labels):
        from keras.utils import np_utils
        print('训练集: %d, label: %d' % (len(data), len(labels)))
        self.model.compile(loss='categorical_crossentropy', optimizer='adadelta', metrics=['accuracy'])
        self.model.fit(np.asarray(data),
                       np_utils.to_categorical(labels, len(chars)),
                       batch_size=500, epochs=150, shuffle=True,
                       verbose=1)

    def load_img(self, img):
        segs = img_util.split_zxr(img if img.mode == 'RGB' else img.convert('RGB'))
        return [255 - np.asarray(seg, dtype='int32') for seg in segs]


class SimpleModel(ZXRModel):
    def __init__(self):
        """
        vggnet简化版
        """
        _model = Sequential()
        _model.add(layers.InputLayer(input_shape=(img_height, img_width, 1)))
        for i in range(2):
            _model.add(layers.Convolution2D(9 * 3 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.Convolution2D(9 * 3 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.MaxPooling2D((2, 2)))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(output_dim=128, activation='tanh'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model


class VGGModel(ZXRModel):
    def __init__(self, training=False):
        """定制的vggnet模型"""
        drop_rate = 0.5 if training else 1.0
        _model = Sequential()
        _model.add(layers.InputLayer(input_shape=(img_height, img_width, 3)))
        for i in range(1, 3):
            _model.add(layers.Convolution2D(16 * 2 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.Convolution2D(16 * 2 ** i, (3, 3), border_mode='valid', activation="relu"))
            _model.add(layers.MaxPooling2D((2, 2), strides=(2, 2)))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(1024, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(1024, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(output_dim=256, activation='relu'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model


class AlexNet(ZXRModel):
    def __init__(self, training=False):
        drop_rate = 0.5 if training else 1.0
        _model = Sequential()
        _model.add(layers.InputLayer((img_height, img_width, 3)))
        _model.add(layers.Convolution2D(16, (5, 5), strides=(2, 2), activation='relu'))
        _model.add(layers.MaxPool2D((2, 2), strides=(2, 2)))
        _model.add(layers.Convolution2D(32, (3, 3), strides=(1, 1), activation='relu'))
        _model.add(layers.MaxPool2D((2, 2), strides=(2, 2)))

        # for _ in range(3):
        _model.add(layers.Convolution2D(96, (2, 2), strides=(1, 1), activation='relu'))
        # _model.add(layers.Convolution2D(64, (3, 3), strides=(1, 1), activation='relu'))

        _model.add(layers.Flatten())
        _model.add(layers.Dense(512, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(512, activation='relu'))
        _model.add(layers.Dropout(drop_rate))
        _model.add(layers.Dense(output_dim=256, activation='relu'))
        _model.add(layers.Dense(len(chars), init='normal', activation='softmax'))
        self.model = _model

© 著作权归作者所有

共有 人打赏支持
下一篇: 消息摘要算法
pseudo

pseudo

粉丝 81
博文 37
码字总数 35469
作品 3
朝阳
程序员
私信 提问
加载中

评论(2)

zyj789
zyj789
麻烦问下:您代码中的from . import img_util 引入的 img_util 是你自己写的吗?如果是的话,能否把代码贴下!谢谢!!!
zyj789
zyj789
麻烦问下:from . import img_util 引入的 img_util 是你自己写的吗?如果是的话,能否把代码贴下!谢谢!!!
截图:【炼数成金】深度学习框架Tensorflow学习与应用

创建图、启动图 Shift+Tab Tab 变量介绍: F etch Feed 简单的模型构造 :线性回归 MNIST数据集 Softmax函数 非线性回归神经网络 MINIST数据集分类器简单版本 二次代价函数 sigmoid函数 交叉...

handy9420
11/19
0
0
裤҉裆҉里҉的҉霸҉气҉/verification-decoder

四位验证码CNN识别 1.参考 [1] 街道多位数字CNN识别,神经网络架构参考 [2] 关于CNN的详细解释,深度学习入门必备 [3] 验证码生成参考类 2.支持 [1] Python3.6.1 or >=3.5 [2] TensorFlow 1....

裤҉裆҉里҉的҉霸҉气҉
2017/11/28
0
0
CNN破解简单验证码(Tensorflow实现)

使用CNN破解一下自己生成的图片验证码,因为电脑性能不行,只破解四位的数字验证码,代码实现中可以对符号、字符和数字混合的验证码进行破解,原理相同,有高性能GPU的童鞋可以试试玩玩。CNN...

cskywit
02/01
0
0
tensorflow 实现端到端的OCR:二代身份证号识别

最近在研究OCR识别相关的东西,最终目标是能识别身份证上的所有中文汉字+数字,不过本文先设定一个小目标,先识别定长为18的身份证号,当然本文的思路也是可以复用来识别定长的验证码识别的。...

某杰
2017/08/08
0
0
一次基于Tensorflow+CNN的验证码识别之旅

对于本次基于卷积神经网络识别验证码有着非常大的兴趣,所以尝试性地去做了测试,过程当中踩了不少坑,也参考了许多前辈的博客和教程,最终识别率可达到98.25% 一、下图是训练的过程: 二、实...

DYBOY
11/26
0
0

没有更多内容

加载失败,请刷新页面

加载更多

区块链安全 - 以太坊短地址攻击

1 基础知识 EVM虚拟机在解析合约的字节码时,依赖的是ABI的定义,从而去识别各个字段位于字节码的什么地方。关于ABI,可以阅读这个文档: https://github.com/ethereum/wiki/wiki/Ethereum-C...

HiBlock
16分钟前
0
0
自定义函数及内部函数

变量的作用域 局部变量 global $Global及其他超全局数组 静态变量 仅初始化赋值 保留于内存直到response才销毁 global和static变量的区别 global:局部变量全局话 static:定义静态局部变量 函...

关元
17分钟前
0
0

中国龙-扬科
29分钟前
1
0
python包

https://www.lfd.uci.edu/~gohlke/pythonlibs/

陆朋
40分钟前
1
0
一文弄懂“分布式锁”,一直以来你的选择依据正确吗?

本文主要会关注的问题是“分布式锁”的问题。 多线程情况下对共享资源的操作需要加锁,避免数据被写乱,在分布式系统中,这个问题也是存在的,此时就需要一个分布式锁服务。 常见的分布式锁实...

Java干货分享
47分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部