Java OCR 图像智能字符识别技术,可识别中文

http://blog.csdn.net/zhoushuyan/article/details/5948289

验证码的OCR方式识别

http://ykf.iteye.com/blog/212431

几天一直在研究OCR技术,据我了解的情况,国内最专业的OCR软件只有2家,清华TH-OCR和汉王OCR,看了很多的OCR技术发现好多对英文与数字的支持都很好,可惜很多都不支持中文字符。Asprise-OCR,Tesseract 3.0以前的版本,都不支持中文,其实我用了下Asprise-OCR算是速度比较的快了,可惜他鄙视中文,这个没有办法,正好这段时间知名的开源OCR引擎Tesseract 3.0版本发布了,他给我们带来的好消息就是支持中文,相关的下载项目网站是:http://code.google.com/p/tesseract-ocr

虽然速度不是很客观可是毕竟人家开始支持中文也算是不错的,一个英文的语言包大概是1.8M,中文简体的语言包是39.5M,中文繁体的语言包是53M,这样就知道为什么识别中文慢的原因了

package com.ocr;

import java.awt.Graphics2D;

import java.awt.color.ColorSpace;

import java.awt.geom.AffineTransform;

import java.awt.image.AffineTransformOp;

import java.awt.image.BufferedImage;

import java.awt.image.ColorConvertOp;

import java.awt.image.ColorModel;

import java.awt.image.MemoryImageSource;

import java.awt.image.PixelGrabber;

/**

*

* 图像过滤,增强OCR识别成功率

*

*/

public class ImageFilter {

private BufferedImage image;

private int iw, ih;

private int[] pixels;

public ImageFilter(BufferedImage image) {

this.image = image;

iw = image.getWidth();

ih = image.getHeight();

pixels = new int[iw * ih];

}

/** 图像二值化 */

public BufferedImage changeGrey() {

PixelGrabber pg = new PixelGrabber(image.getSource(), 0, 0, iw, ih, pixels, 0,iw);

try {

pg.grabPixels();

catch (InterruptedException e) {

e.printStackTrace();

}

// 设定二值化的域值,默认值为100

int grey = 100;

// 对图像进行二值化处理,Alpha值保持不变

ColorModel cm = ColorModel.getRGBdefault();

for (int i = 0; i < iw * ih; i++) {

int red, green, blue;

int alpha = cm.getAlpha(pixels[i]);

if (cm.getRed(pixels[i]) > grey) {

red = 255;

else {

red = 0;

}

if (cm.getGreen(pixels[i]) > grey) {

green = 255;

else {

green = 0;

}

if (cm.getBlue(pixels[i]) > grey) {

blue = 255;

else {

blue = 0;

}

pixels[i] = alpha << 24 | red << 16 | green << 8 | blue;

}

// 将数组中的象素产生一个图像

return ImageIOHelper.imageProducerToBufferedImage(new MemoryImageSource(iw, ih,pixels, 0, iw));

}

/** 提升清晰度,进行锐化 */

public BufferedImage sharp() {

PixelGrabber pg = new PixelGrabber(image.getSource(), 0, 0, iw, ih, pixels, 0,iw);

try {

pg.grabPixels();

catch (InterruptedException e) {

e.printStackTrace();

}

// 象素的中间变量

int tempPixels[] = new int[iw * ih];

for (int i = 0; i < iw * ih; i++) {

tempPixels[i] = pixels[i];

}

// 对图像进行尖锐化处理,Alpha值保持不变

ColorModel cm = ColorModel.getRGBdefault();

for (int i = 1; i < ih - 1; i++) {

for (int j = 1; j < iw - 1; j++) {

int alpha = cm.getAlpha(pixels[i * iw + j]);

// 对图像进行尖锐化

int red6 = cm.getRed(pixels[i * iw + j + 1]);

int red5 = cm.getRed(pixels[i * iw + j]);

int red8 = cm.getRed(pixels[(i + 1) * iw + j]);

int sharpRed = Math.abs(red6 - red5) + Math.abs(red8 - red5);

int green5 = cm.getGreen(pixels[i * iw + j]);

int green6 = cm.getGreen(pixels[i * iw + j + 1]);

int green8 = cm.getGreen(pixels[(i + 1) * iw + j]);

int sharpGreen = Math.abs(green6 - green5) + Math.abs(green8 - green5);

int blue5 = cm.getBlue(pixels[i * iw + j]);

int blue6 = cm.getBlue(pixels[i * iw + j + 1]);

int blue8 = cm.getBlue(pixels[(i + 1) * iw + j]);

int sharpBlue = Math.abs(blue6 - blue5) + Math.abs(blue8 - blue5);

if (sharpRed > 255) {

sharpRed = 255;

}

if (sharpGreen > 255) {

sharpGreen = 255;

}

if (sharpBlue > 255) {

sharpBlue = 255;

}

tempPixels[i * iw + j] = alpha << 24 | sharpRed << 16 | sharpGreen << 8 | sharpBlue;

}

}

// 将数组中的象素产生一个图像

return ImageIOHelper.imageProducerToBufferedImage(new MemoryImageSource(iw, ih, tempPixels, 0, iw));

}

/** 中值滤波 */

public BufferedImage median() {

PixelGrabber pg = new PixelGrabber(image.getSource(), 0, 0, iw, ih, pixels, 0,iw);

try {

pg.grabPixels();

catch (InterruptedException e) {

e.printStackTrace();

}

// 对图像进行中值滤波,Alpha值保持不变

ColorModel cm = ColorModel.getRGBdefault();

for (int i = 1; i < ih - 1; i++) {

for (int j = 1; j < iw - 1; j++) {

int red, green, blue;

int alpha = cm.getAlpha(pixels[i * iw + j]);

// int red2 = cm.getRed(pixels[(i - 1) * iw + j]);

int red4 = cm.getRed(pixels[i * iw + j - 1]);

int red5 = cm.getRed(pixels[i * iw + j]);

int red6 = cm.getRed(pixels[i * iw + j + 1]);

// int red8 = cm.getRed(pixels[(i + 1) * iw + j]);

// 水平方向进行中值滤波

if (red4 >= red5) {

if (red5 >= red6) {

red = red5;

else {

if (red4 >= red6) {

red = red6;

else {

red = red4;

}

}

else {

if (red4 > red6) {

red = red4;

else {

if (red5 > red6) {

red = red6;

else {

red = red5;

}

}

}

// int green2 = cm.getGreen(pixels[(i - 1) * iw + j]);

int green4 = cm.getGreen(pixels[i * iw + j - 1]);

int green5 = cm.getGreen(pixels[i * iw + j]);

int green6 = cm.getGreen(pixels[i * iw + j + 1]);

// int green8 = cm.getGreen(pixels[(i + 1) * iw + j]);

// 水平方向进行中值滤波

if (green4 >= green5) {

if (green5 >= green6) {

green = green5;

else {

if (green4 >= green6) {

green = green6;

else {

green = green4;

}

}

else {

if (green4 > green6) {

green = green4;

else {

if (green5 > green6) {

green = green6;

else {

green = green5;

}

}

}

// int blue2 = cm.getBlue(pixels[(i - 1) * iw + j]);

int blue4 = cm.getBlue(pixels[i * iw + j - 1]);

int blue5 = cm.getBlue(pixels[i * iw + j]);

int blue6 = cm.getBlue(pixels[i * iw + j + 1]);

// int blue8 = cm.getBlue(pixels[(i + 1) * iw + j]);

// 水平方向进行中值滤波

if (blue4 >= blue5) {

if (blue5 >= blue6) {

blue = blue5;

else {

if (blue4 >= blue6) {

blue = blue6;

else {

blue = blue4;

}

}

else {

if (blue4 > blue6) {

blue = blue4;

else {

if (blue5 > blue6) {

blue = blue6;

else {

blue = blue5;

}

}

}

pixels[i * iw + j] = alpha << 24 | red << 16 | green << 8 | blue;

}

}

// 将数组中的象素产生一个图像

return ImageIOHelper.imageProducerToBufferedImage(new MemoryImageSource(iw, ih,pixels, 0, iw));

}

/** 线性灰度变换 */

public BufferedImage lineGrey() {

PixelGrabber pg = new PixelGrabber(image.getSource(), 0, 0, iw, ih, pixels, 0,iw);

try {

pg.grabPixels();

catch (InterruptedException e) {

e.printStackTrace();

}

// 对图像进行进行线性拉伸,Alpha值保持不变

ColorModel cm = ColorModel.getRGBdefault();

for (int i = 0; i < iw * ih; i++) {

int alpha = cm.getAlpha(pixels[i]);

int red = cm.getRed(pixels[i]);

int green = cm.getGreen(pixels[i]);

int blue = cm.getBlue(pixels[i]);

// 增加了图像的亮度

red = (int) (1.1 * red + 30);

green = (int) (1.1 * green + 30);

blue = (int) (1.1 * blue + 30);

if (red >= 255) {

red = 255;

}

if (green >= 255) {

green = 255;

}

if (blue >= 255) {

blue = 255;

}

pixels[i] = alpha << 24 | red << 16 | green << 8 | blue;

}

// 将数组中的象素产生一个图像

return ImageIOHelper.imageProducerToBufferedImage(new MemoryImageSource(iw, ih,pixels, 0, iw));

}

/** 转换为黑白灰度图 */

public BufferedImage grayFilter() {

ColorSpace cs = ColorSpace.getInstance(ColorSpace.CS_GRAY);

ColorConvertOp op = new ColorConvertOp(cs, null);

return op.filter(image, null);

}

/** 平滑缩放 */

public BufferedImage scaling(double s) {

AffineTransform tx = new AffineTransform();

tx.scale(s, s);

AffineTransformOp op = new AffineTransformOp(tx, AffineTransformOp.TYPE_BILINEAR);

return op.filter(image, null);

}

public BufferedImage scale(Float s) {

int srcW = image.getWidth();

int srcH = image.getHeight();

int newW = Math.round(srcW * s);

int newH = Math.round(srcH * s);

// 先做水平方向上的伸缩变换

BufferedImage tmp=new BufferedImage(newW, newH, image.getType());

Graphics2D g= tmp.createGraphics();

for (int x = 0; x < newW; x++) {

g.setClip(x, 0, 1, srcH);

// 按比例放缩

g.drawImage(image, x - x * srcW / newW, 0, null);

}

// 再做垂直方向上的伸缩变换

BufferedImage dst = new BufferedImage(newW, newH, image.getType());

g = dst.createGraphics();

for (int y = 0; y < newH; y++) {

g.setClip(0, y, newW, 1);

// 按比例放缩

g.drawImage(tmp, 0, y - y * srcH / newH, null);

}

return dst;

}

}

package com.ocr;

import java.awt.Graphics2D;

import java.awt.Image;

import java.awt.Toolkit;

import java.awt.image.BufferedImage;

import java.awt.image.DataBufferByte;

import java.awt.image.ImageProducer;

import java.awt.image.WritableRaster;

import java.io.File;

import java.io.IOException;

import java.util.Iterator;

import java.util.Locale;

import javax.imageio.IIOImage;

import javax.imageio.ImageIO;

import javax.imageio.ImageReader;

import javax.imageio.ImageWriteParam;

import javax.imageio.ImageWriter;

import javax.imageio.metadata.IIOMetadata;

import javax.imageio.stream.ImageInputStream;

import javax.imageio.stream.ImageOutputStream;

import javax.swing.JOptionPane;

import com.sun.media.imageio.plugins.tiff.TIFFImageWriteParam;

public class ImageIOHelper {

public ImageIOHelper() {

}

public static File createImage(File imageFile, String imageFormat) {

File tempFile = null;

try {

Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat);

ImageReader reader = readers.next();

ImageInputStream iis = ImageIO.createImageInputStream(imageFile);

reader.setInput(iis);

// Read the stream metadata

IIOMetadata streamMetadata = reader.getStreamMetadata();

// Set up the writeParam

TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.US);

tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);

// Get tif writer and set output to file

Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff");

ImageWriter writer = writers.next();

BufferedImage bi = reader.read(0);

IIOImage image = new IIOImage(bi, null, reader.getImageMetadata(0));

tempFile = tempImageFile(imageFile);

ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);

writer.setOutput(ios);

writer.write(streamMetadata, image, tiffWriteParam);

ios.close();

writer.dispose();

reader.dispose();

catch (Exception exc) {

exc.printStackTrace();

}

return tempFile;

}

public static File createImage(BufferedImage bi) {

File tempFile = null;

try {

tempFile = File.createTempFile("tempImageFile", ".tif");

tempFile.deleteOnExit();

TIFFImageWriteParam tiffWriteParam = new TIFFImageWriteParam(Locale.US);

tiffWriteParam.setCompressionMode(ImageWriteParam.MODE_DISABLED);

// Get tif writer and set output to file

Iterator<ImageWriter> writers = ImageIO.getImageWritersByFormatName("tiff");

ImageWriter writer = writers.next();

IIOImage image = new IIOImage(bi, nullnull);

tempFile = tempImageFile(tempFile);

ImageOutputStream ios = ImageIO.createImageOutputStream(tempFile);

writer.setOutput(ios);

writer.write(null, image, tiffWriteParam);

ios.close();

writer.dispose();

catch (Exception exc) {

exc.printStackTrace();

}

return tempFile;

}

public static File tempImageFile(File imageFile) {

String path = imageFile.getPath();

StringBuffer strB = new StringBuffer(path);

strB.insert(path.lastIndexOf(‘.‘), 0);

return new File(strB.toString().replaceFirst("(?<=//.)(//w+)$", "tif"));

}

public static BufferedImage getImage(File imageFile) {

BufferedImage al = null;

try {

String imageFileName = imageFile.getName();

String imageFormat = imageFileName.substring(imageFileName.lastIndexOf(‘.‘) + 1);

Iterator<ImageReader> readers = ImageIO.getImageReadersByFormatName(imageFormat);

ImageReader reader = readers.next();

if (reader == null) {

JOptionPane.showConfirmDialog(null,

"Need to install JAI Image I/O package./nhttps://jai-imageio.dev.java.net");

return null;

}

ImageInputStream iis = ImageIO.createImageInputStream(imageFile);

reader.setInput(iis);

al = reader.read(0);

reader.dispose();

catch (IOException ioe) {

System.err.println(ioe.getMessage());

catch (Exception e) {

System.err.println(e.getMessage());

}

return al;

}

public static BufferedImage imageToBufferedImage(Image image) {

BufferedImage bufferedImage = new BufferedImage(image.getWidth(null), image.getHeight(null),

BufferedImage.TYPE_INT_RGB);

Graphics2D g = bufferedImage.createGraphics();

g.drawImage(image, 0, 0, null);

return bufferedImage;

}

public static BufferedImage imageProducerToBufferedImage(ImageProducer imageProducer) {

returnimageToBufferedImage(Toolkit.getDefaultToolkit().createImage(imageProducer));

}

public static byte[] image_byte_data(BufferedImage image) {

WritableRaster raster = image.getRaster();

DataBufferByte buffer = (DataBufferByte) raster.getDataBuffer();

return buffer.getData();

}

}

package com.ocr;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.InputStreamReader;

import java.util.ArrayList;

import java.util.List;

import org.jdesktop.swingx.util.OS;

public class OCR {

private final String LANG_OPTION = "-l";

private final String EOL = System.getProperty("line.separator");

private String tessPath = new File("tesseract").getAbsolutePath();

//private String tessPath="C://Program Files (x86)//Tesseract-OCR//";

public String recognizeText(File imageFile, String imageFormat) throws Exception {

File tempImage = ImageIOHelper.createImage(imageFile, imageFormat);

File outputFile = new File(imageFile.getParentFile(), "output");

StringBuffer strB = new StringBuffer();

List<String> cmd = new ArrayList<String>();

if (OS.isWindowsXP()) {

cmd.add(tessPath + "//tesseract");

//cmd.add(tessPath + "//Tesseract-OCR");

else if (OS.isLinux()) {

cmd.add("tesseract");

else {

//cmd.add(tessPath + "//Tesseract-OCR");

cmd.add(tessPath + "//tesseract");

}

cmd.add("");

cmd.add(outputFile.getName());

cmd.add(LANG_OPTION);

cmd.add("chi_sim");

cmd.add("eng");

ProcessBuilder pb = new ProcessBuilder();

pb.directory(imageFile.getParentFile());

cmd.set(1, tempImage.getName());

pb.command(cmd);

pb.redirectErrorStream(true);

Process process = pb.start();

//tesseract.exe 1.jpg 1 -l chi_sim

int w = process.waitFor();

// delete temp working files

tempImage.delete();

if (w == 0) {

BufferedReader in = new BufferedReader(new InputStreamReader(newFileInputStream(outputFile

.getAbsolutePath()

+ ".txt"), "UTF-8"));

String str;

while ((str = in.readLine()) != null) {

strB.append(str).append(EOL);

}

in.close();

else {

String msg;

switch (w) {

case 1:

msg = "Errors accessing files. There may be spaces in your image‘s filename.";

break;

case 29:

msg = "Cannot recognize the image or its selected region.";

break;

case 31:

msg = "Unsupported image format.";

break;

default:

msg = "Errors occurred.";

}

tempImage.delete();

throw new RuntimeException(msg);

}

new File(outputFile.getAbsolutePath() + ".txt").delete();

return strB.toString();

}

}

package com.ocr;

import java.io.File;

public class Test {

/**

@param args

*/

public static void main(String[] args) {

// TODO Auto-generated method stub

OCR ocr=new OCR();

try {

String maybe = new OCR().recognizeText(new  File("E://temp//222.jpg"),"jpg");

System.out.println(maybe);

catch (Exception e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

}

}

由于可以第三方包加起来有点大,告诉大家一个网站 www.findjar.com去里面找你想要的包吧,需要相关包的留下邮件吧

java 目录结构如上图

效果图:

解析出来的效果

原文地址:https://www.cnblogs.com/pejsidney/p/9487888.html

时间: 2024-11-10 15:04:28

Java OCR 图像智能字符识别技术,可识别中文的相关文章

Java OCR tesseract 图像智能字符识别技术 Java实现

Java OCR tesseract 图像智能字符识别技术 Java代码实现 接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下java实现的例子. 拿代码扫描上面的图片,然后输出结果.主要思想就是利用Java调用系统任务. 下面是核心代码: /** * * * @author mjorcen * @email [email protected] * @dateTime Jun 19, 2014 3:

Java OCR tesseract 图像智能字符识别技术 Java代码实现

Java OCR tesseract 图像智能字符识别技术 Java代码实现 接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下java实现的例子. 拿代码扫描上面的图片,然后输出结果.主要思想就是利用Java调用系统任务. 下面是核心代码: Java OCR tesseract 图像智能字符识别技术 Java代码实现

Java OCR tesseract 图像智能字符识别技术

公司有需求啊,所以就得研究哈.近期公司须要读验证码.于是就研究起了图像识别.应该就是传说中的(OCR:光学字符识别OCR),以下把今天的收获整理一个给大家做个分享. 本人程序用的tesseract,官方地址:https://code.google.com/p/tesseract-ocr/.不为别的,谁让它支持我们的天朝的文字呢~哈 下载好程序后解压: 大概能够看到这样一个文件夹.别见怪楼主里面一堆測试文件. 然后就開始我们的測试之旅: tesseract的使用方法: 參数1:须要识别的文件 參数

移动端车牌识别,OCR光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术.在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果--"文字图像识别技术TH-OCR"产业化,真正实现了TH-OCR技术与市场应用的完美结合. 一.移动端车牌识别应用背景 随着我国警务通.停车场手持收费机等移动终端的使用越来越普及,车辆越来越多,对车的管理要高效也是必然的,如果在这些终端上能够集成车牌识别功能,必然省时省力,对于维护交通安全和

OCR光学字符识别技术是AI人工智能的基础

现在很多款手机软件都集成了OCR光学字符识别技术(Optical Character Recognition),可以通过手机拍照或摄像头扫描,就可自动识别并提取出所拍摄图像中的数据信息,比如:当我在看英语书的时候,遇到不懂的单词或想直接知道该段英文的翻译,那么可以直接使用手机上集成了OCR的自动识别软件,进行拍照识别或是扫描识别,然后会直接给出识别结果,识别准确率也很高. 这种集成了OCR的识别技术,被成为文字识别OCR技术. 目前,文字识别技术应用在教育教学.报纸报刊.图书馆.新闻媒体等领域,

OCR光学字符识别技术,改变传统工作模式

自2015年以来,国内"三证合一"登记制度改革如火如荼的进行,国务院.有关部门及税务总局陆续下发了一系列文件,对"三证合一"改革有关工作做出了详细部署并提出了明确要求.到2015年底全国发出了350.94万张"三证合一"的营业执照,已取得显著效果.同时伴随着企业实名制验证等问题也随之而来,因此也衍生出一些软件代替人去识别证件内的信息并将信息提取出来. OCR光学字符识别技术是基础--针对移动互联网数据采集业务推出了OCR识别软件,例如可以识别营业

【OCR技术系列之一】字符识别技术总览

最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够接受.人又可以理解的格式.文字识别是计算机视觉研究领域的分支之一,而且这个课题已经是比较成熟了,并且在商业中已经有很多落地项

智能锁四大生物识别技术对比分析

前智能锁识别主要有四大生物识别技术,分别是指静脉.指纹.人脸和虹膜.这些技术或许大家都听说过,但是具体原理是什么,如何实现,各有什么特点和优缺点?本文就来总结分析下. 指静脉识别 技术原理:指静脉识别是利用检测手指静脉血管的纹路特征实现身份认证.医学研究发现当用近红外线照射手指时,静脉中流动的血红蛋白会吸收近红外线从而形成血管的影像,通过传感器可以获取手指静脉的图像并经算法处理形成特定的指静脉模板.经过医学的验证,每个人的手指静脉血管影像都不一样,形成的模板是一种独特的生物特征,可用于进行身份的

光学字符识别技术

首先,请允许我隆重介绍一下--OCR识别,OCR(Optical Character Recognition),中文名叫光学字符识别.如今的它应该在技术领域上那是小有名气了,毕竟它可是实用型技术的代表,技术融入生活最快最好的方式那就是利用与商业化.如何通过识别软件将图像中的信息提取或文字转换文本格式,或者解决除错和利用辅助信息提高识别的正确率,是OCR识别的最重要课题.下面就来详细了解一下OCR识别技术的核心. 1.图像输入:要进行OCR识别,第一步就是通过采集所要识别的图像,可以是名片.身份证