文档章节

图像识别 - 提取验证码信息

o
 osc_w9s1w4o0
发布于 2019/04/01 13:24
字数 1196
阅读 3
收藏 0

精选30+云产品,助力企业轻松上云!>>>

1、Tess4j

最近在GitHub上看到一个图像识别的开源框架tess4j,而且是Java版的,为此利用此框架来识别验证码中的信息,利用它提供的字体库,来提取信息,对于没有什么干扰线的验证码准确率还是蛮高的,对于有一些干扰线的就差一些,不过也可以能通过训练字体库,从而可以提高准确率的。

根据范例,写了一个简单的提取验证码信息的工具类VerificationCode:

主要是用这个类的extract方法,这个方法有3个参数:

  • 第1个参数是指定图片的路径
  • 第2个参数是指定字体库的,其中chi_sim表示中文简体,eng表示英文
  • 第3个参数是指定是否需要去除干扰线,true表示需要,false表示不需要
package com.swnote.tess4j.test;

import java.awt.image.BufferedImage;
import java.io.File;

import javax.imageio.ImageIO;

import com.recognition.software.jdeskew.ImageDeskew;

import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.util.ImageHelper;

/**
 * 识别验证码
 * 
 * @author lzj
 * @date [2019-03-03]
 */
public class VerificationCode {
    
    /**
     * 配置文件
     */
    private static String config_path = "src/main/resources";
    
    /**
     * 调整倾斜度的阈值
     */
    private static double deskew_threshold = 0.05d;
    
    /**
     * 提取验证码图片中的文字
     * 
     * @param img_path
     * @param lang
     * @param clear
     * @return
     */
    public static String extract(String img_path, String lang, boolean clear) throws Exception {
        // 图片文件
        File img = new File(img_path);
        
        if (clear) {
            // 将去除干扰后的图片保存在同级目录下的ext目录下
            String ext_path = img.getParentFile().getPath() + "/ext";
            
            // 去除干扰
            CleanImage.cleanLinesInImage(img, ext_path);
            
            // 处理后的图片
            img = new File(ext_path, img.getName());
        }
        
        // 设置语言库
        ITesseract instance = new Tesseract();
        File directory = new File(config_path);
        String course_file = directory.getCanonicalPath();
        instance.setDatapath(course_file + "/tessdata");
        // chi_sim表示中文简体
        // eng表示英文
        instance.setLanguage(lang);
        
        BufferedImage buffer_img = ImageIO.read(img);
        ImageDeskew img_deskew = new ImageDeskew(buffer_img);
        double img_skew_angle = img_deskew.getSkewAngle(); 
        if ((img_skew_angle > deskew_threshold || img_skew_angle < -(deskew_threshold))) {
            buffer_img = ImageHelper.rotateImage(buffer_img, -img_skew_angle);
        }

        String result = instance.doOCR(buffer_img);
        
        return result;
    }
}

其中CleanImage类是用于清楚验证码干扰线的,这个类是我从网上找到的,加上这个类有一定的效果,但是不是特别理想,希望大家能够找到更好的去除干扰线方式。

在此也贴一下CleanImage类的代码:

package com.swnote.tess4j.test;

import java.awt.Color;
import java.awt.image.BufferedImage;
import java.io.File;
import java.io.IOException;

import javax.imageio.ImageIO;

/**
 * 网上找到清除图片干扰工具
 */
public class CleanImage {
    
    public static void cleanLinesInImage(File sfile, String destDir) throws IOException {
        File destF = new File(destDir);
        if (!destF.exists()) {
            destF.mkdirs();
        }

        BufferedImage bufferedImage = ImageIO.read(sfile);
        int h = bufferedImage.getHeight();
        int w = bufferedImage.getWidth();

        // 灰度化
        int[][] gray = new int[w][h];
        for (int x = 0; x < w; x++) {
            for (int y = 0; y < h; y++) {
                int argb = bufferedImage.getRGB(x, y);
                // 图像加亮(调整亮度识别率非常高)
                int r = (int) (((argb >> 16) & 0xFF) * 1.1 + 30);
                int g = (int) (((argb >> 8) & 0xFF) * 1.1 + 30);
                int b = (int) (((argb >> 0) & 0xFF) * 1.1 + 30);
                if (r >= 255) {
                    r = 255;
                }
                if (g >= 255) {
                    g = 255;
                }
                if (b >= 255) {
                    b = 255;
                }
                gray[x][y] = (int) Math.pow(
                        (Math.pow(r, 2.2) * 0.2973 + Math.pow(g, 2.2) * 0.6274 + Math.pow(b, 2.2) * 0.0753), 1 / 2.2);
            }
        }

        // 二值化
        int threshold = ostu(gray, w, h);
        BufferedImage binaryBufferedImage = new BufferedImage(w, h, BufferedImage.TYPE_BYTE_BINARY);
        for (int x = 0; x < w; x++) {
            for (int y = 0; y < h; y++) {
                if (gray[x][y] > threshold) {
                    gray[x][y] |= 0x00FFFF;
                } else {
                    gray[x][y] &= 0xFF0000;
                }
                binaryBufferedImage.setRGB(x, y, gray[x][y]);
            }
        }

        // 去除干扰线条
        for (int y = 1; y < h - 1; y++) {
            for (int x = 1; x < w - 1; x++) {
                boolean flag = false;
                if (isBlack(binaryBufferedImage.getRGB(x, y))) {
                    // 左右均为空时,去掉此点
                    if (isWhite(binaryBufferedImage.getRGB(x - 1, y))
                            && isWhite(binaryBufferedImage.getRGB(x + 1, y))) {
                        flag = true;
                    }
                    // 上下均为空时,去掉此点
                    if (isWhite(binaryBufferedImage.getRGB(x, y + 1))
                            && isWhite(binaryBufferedImage.getRGB(x, y - 1))) {
                        flag = true;
                    }
                    // 斜上下为空时,去掉此点
                    if (isWhite(binaryBufferedImage.getRGB(x - 1, y + 1))
                            && isWhite(binaryBufferedImage.getRGB(x + 1, y - 1))) {
                        flag = true;
                    }
                    if (isWhite(binaryBufferedImage.getRGB(x + 1, y + 1))
                            && isWhite(binaryBufferedImage.getRGB(x - 1, y - 1))) {
                        flag = true;
                    }
                    if (flag) {
                        binaryBufferedImage.setRGB(x, y, -1);
                    }
                }
            }
        }

        // 矩阵打印
//        for (int y = 0; y < h; y++) {
//            for (int x = 0; x < w; x++) {
//                if (isBlack(binaryBufferedImage.getRGB(x, y))) {
//                    System.out.print("*");
//                } else {
//                    System.out.print(" ");
//                }
//            }
//            System.out.println();
//        }

        ImageIO.write(binaryBufferedImage, "jpg", new File(destDir, sfile.getName()));
    }

    public static boolean isBlack(int colorInt) {
        Color color = new Color(colorInt);
        if (color.getRed() + color.getGreen() + color.getBlue() <= 300) {
            return true;
        }
        return false;
    }

    public static boolean isWhite(int colorInt) {
        Color color = new Color(colorInt);
        if (color.getRed() + color.getGreen() + color.getBlue() > 300) {
            return true;
        }
        return false;
    }

    public static int isBlackOrWhite(int colorInt) {
        if (getColorBright(colorInt) < 30 || getColorBright(colorInt) > 730) {
            return 1;
        }
        return 0;
    }

    public static int getColorBright(int colorInt) {
        Color color = new Color(colorInt);
        return color.getRed() + color.getGreen() + color.getBlue();
    }

    public static int ostu(int[][] gray, int w, int h) {
        int[] histData = new int[w * h];
        // Calculate histogram
        for (int x = 0; x < w; x++) {
            for (int y = 0; y < h; y++) {
                int red = 0xFF & gray[x][y];
                histData[red]++;
            }
        }

        // Total number of pixels
        int total = w * h;

        float sum = 0;
        for (int t = 0; t < 256; t++)
            sum += t * histData[t];

        float sumB = 0;
        int wB = 0;
        int wF = 0;

        float varMax = 0;
        int threshold = 0;

        for (int t = 0; t < 256; t++) {
            wB += histData[t]; // Weight Background
            if (wB == 0)
                continue;

            wF = total - wB; // Weight Foreground
            if (wF == 0)
                break;

            sumB += (float) (t * histData[t]);

            float mB = sumB / wB; // Mean Background
            float mF = (sum - sumB) / wF; // Mean Foreground

            // Calculate Between Class Variance
            float varBetween = (float) wB * (float) wF * (mB - mF) * (mB - mF);

            // Check if new maximum found
            if (varBetween > varMax) {
                varMax = varBetween;
                threshold = t;
            }
        }

        return threshold;
    }
}

2、测试

首先测试一张没有干扰线的图片,即:

然后调用工具类,可以得到如下结果:

结果是正确的。

再一测试一个中文的,同时具有干扰线的,即:

测试结果为:

中文内容是识别出来了,但是也识别了一些其它信息。

关注我

以你最方便的方式关注我: 微信公众号:

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
python 基于机器学习识别验证码

1、背景 验证码自动识别在模拟登陆上使用的较为广泛,一直有耳闻好多人在使用机器学习来识别验证码,最近因为刚好接触这方面的知识,所以特定研究了一番。发现网上已有很多基于machine learn...

osc_tbh7hwku
2018/10/18
2
0
深度学习实战教程(2)--Caffe下实现验证码识别

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/lwplwf/article/details/82684933 传统验证码识别:传统方法通常是先对验证码图像进行字符分割,再进行特征提...

零尾
2018/09/13
0
0
万物皆可 Serverless 之使用云函数 SCF 快速部署验证码识别接口

验证码识别是搞爬虫实现自动化脚本避不开的一个问题。通常验证码识别程序要么部署在本地,要么部署在服务器端。如果部署在服务器端就需要自己去搭建配置网络环境并编写调用接口,这是一个极其...

osc_cdixgndu
06/09
4
0
万物皆可 Serverless 之使用云函数 SCF 快速部署验证码识别接口

验证码识别是搞爬虫实现自动化脚本避不开的一个问题。通常验证码识别程序要么部署在本地,要么部署在服务器端。如果部署在服务器端就需要自己去搭建配置网络环境并编写调用接口,这是一个极其...

Serverless
06/08
0
0

没有更多内容

加载失败,请刷新页面

加载更多

R中“ =”和“ <-”赋值运算符有什么区别?

问题: What are the differences between the assignment operators = and <- in R? R中赋值运算符=和<-之间有什么区别? I know that operators are slightly different, as this example ......

fyin1314
29分钟前
14
0
JavaScript中的静态变量 - Static variables in JavaScript

问题: 如何在Javascript中创建静态变量? 解决方案: 参考一: https://stackoom.com/question/6RUF/JavaScript中的静态变量 参考二: https://oldbug.net/q/6RUF/Static-variables-in-Java...

法国红酒甜
今天
14
0
之间的区别 和

问题: I'm learning Spring 3 and I don't seem to grasp the functionality behind <context:annotation-config> and <context:component-scan> . 我正在学习Spring 3,并且似乎不太了解<......

javail
今天
15
0
业内首款,百度工业视觉智能平台全新亮相

本文作者:y****n 业内首款全国产化工业视觉智能平台——百度工业视觉智能平台亮相中国机器视觉展(Vision China),该平台所具有的核心AI能力完全自主可控,在质检、巡检等场景中具有高效、...

百度开发者中心
昨天
7
0
我们如何制作xkcd样式图? - How can we make xkcd style graphs?

问题: Apparently, folk have figured out how to make xkcd style graphs in Mathematica and in LaTeX . 显然,民间已经想出了如何在Mathematica和LaTeX中制作xkcd风格的图形。 Can we d......

富含淀粉
今天
10
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部