C# 图片识别技术(支持21种语言,提取图片中的文字)

图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号。

图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量注册的目的,但我觉得它最吸引我的地方是可以让一些书写的东西,自动识别成电脑上的文字,比如说手拟的合同,修改过的书面论文或者是文档,每月的花费发票需要在电脑上录入或者是汇总信息,日记本上的文章要转移到电脑上等等,我们现在就不用再头痛把它们在电脑上敲写一遍了。

本文介绍两种比较主流和成熟的识别方式:

方式一、Asprise-OCR实现。

方式二、Microsoft Office Document Imaging(Office 2007) 组件实现。

方式一、Asprise-OCR的使用。

Asprise-OCR下载地址:

http://asprise.com/product/ocr/download.php?lang=csharp

其中需要使用的3个dll是AspriseOCR.dll、DevIL.dll、ILU.dll。

需要注意的是这几个.dll是vc写的引用要在程序中用DllImport引用,关键代码:

[DllImport("AspriseOCR.dll", EntryPoint = "OCR", CallingConvention = CallingConvention.Cdecl)]

public static extern IntPtr OCR(string file, int type);

[DllImport("AspriseOCR.dll", EntryPoint = "OCRpart", CallingConvention = CallingConvention.Cdecl)]

static extern IntPtr OCRpart(string file, int type, int startX, int startY, int width, int height);

[DllImport("AspriseOCR.dll", EntryPoint = "OCRBarCodes", CallingConvention = CallingConvention.Cdecl)]

static extern IntPtr OCRBarCodes(string file, int type);

[DllImport("AspriseOCR.dll", EntryPoint = "OCRpartBarCodes", CallingConvention = CallingConvention.Cdecl)]

static extern IntPtr OCRpartBarCodes(string file, int type, int startX, int startY, int width, int height);

调用代码很简单只有一句:

MessageBox.Show(Marshal.PtrToStringAnsi(OCRpart(img_path, -1, startX, startY, width, height)));

其中img_path:为图片路径,startX、startY坐标均为0即可,width、height图片的宽和高。

方式二、Microsoft Office Document Imaging(Office 2007) 组件实现。

在使用之前需要给大家说的是Imaging 组件的兼容性不是很好,使用win 7 office 2007的时必须打上office 2007 sp1或者sp2补丁,读取中文才行。

sp1补丁地址(226M) :

http://download.microsoft.com/download/1/6/5/1659d607-8696-4001-8072-efaedd70dd30/office2007sp1-kb936982-fullfile-zh-cn.exe

sp2补丁地址(301 MB):

http://download.microsoft.com/download/A/3/9/A39E919E-AFA8-4128-9249-51629206C70F/office2007sp2-kb953195-fullfile-zh-cn.exe

给项目添加组件引用,如图:

使用代码:

MODI.Document doc = new MODI.Document();

doc.Create(img_Path);

MODI.Image image;

MODI.Layout layout;

doc.OCR(MODI.MiLANGUAGES.miLANG_CHINESE_SIMPLIFIED, true, true);  // 识别简体中文

for (int i = 0; i < doc.Images.Count; i++)

{

image = (MODI.Image)doc.Images[i];

layout = image.Layout;

sb.Append(layout.Text);

}

MessageBox.Show(sb.ToString());

其中img_Path为图片路径,MODI.MiLANGUAGES为读取图片的文字类型枚举。

本文源码下载地址:http://files.cnblogs.com/stone_w/OCR.rar

时间: 2024-11-06 13:01:25

C# 图片识别技术(支持21种语言,提取图片中的文字)的相关文章

C# 图片识别(支持21种语言) (转)

图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号. 图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量注册的目的,但我觉得它最吸引我的地方是可以让一些书写的东西,自动识别成电脑上的文字,比如说手拟的合同,修改过的书面论文或者是文档,每月的花费发票需要在电脑上录入或者是汇总信息,日记本上的文章要转移到电脑上等等,我们现在就不用再头痛把它们在电脑上敲写一遍了. 本文介绍两种比较主流和成熟的识别方式: 方

C# 图片识别(支持21种语言)

图片识别的技术到几天已经很成熟了,只是相关的资料很少,为了方便在此汇总一下(C#实现),方便需要的朋友查阅,也给自己做个记号. 图片识别的用途:很多人用它去破解网站的验证码,用于达到自动刷票或者是批量注册的目的,但我觉得它最吸引我的地方是可以让一些书写的东西,自动识别成电脑上的文字,比如说手拟的合同,修改过的书面论文或者是文档,每月的花费发票需要在电脑上录入或者是汇总信息,日记本上的文章要转移到电脑上等等,我们现在就不用再头痛把它们在电脑上敲写一遍了. 本文介绍两种比较主流和成熟的识别方式: 方

[转自老马的文章]用MODI OCR 21种语言

作者:马健邮箱:[email protected]发布:2007.12.08更新:2012.07.09按照<MODI中的OCR模块>一文相关内容进行修订2012.07.02按照新版Pdg2Pic的情况对内容进行补充2012.06.11标题从<在简体中文Office 2003下OCR繁体中文.日文.韩文>改为<用MODI OCR 21种语言> 目录1 安装MODI    1.1 Office 2003下安装MODI    1.2 Office 2007下安装MODI   

iOS开发类似于呱呱卡效果,手指划过的区域形成画笔。适用于取出部分图片(截图),如截取出图片中带文字的区域部分。

HKBrushShots Demo下载地址: 类似于呱呱卡效果,手指划过的路线可以刮出痕迹. ??功能: 用于取出部分图片(截图),如截取出图片中带文字的区域部分. ??效果: 截取出图片中的“你就是我的全世界”文字区域的图片: 截取出图片中那只呆萌的小犀牛??: 更多截图效果: ??使用: 1 - 首先将工程中的“HKScreenShot”文件夹拷贝至项目中. 2 - 在需要使用的类中引入头文件: #import "HKCropView.h" #import "HKLine

支持10种语言的在线版邮件群发软件-Zoho Campaigns

发邮件早已成为我们工作与生活中不可或缺的一项任务.从现在开始,Zoho Campaigns支持多语言版本,让您不论在世界的哪个角落工作,都可以用上当地的语言.现在除了英语,您还可以使用以下这些语言: 中文 荷兰语 法语 德语 匈牙利语 意大利语 日语 葡萄牙语 西班牙语 随着Zoho CRM 10用户免费版的普及,产品相互集成的功能受到用户的推崇.越来越多的CRM用户喜欢与Campaigns集成起来用.现在,这两种产品可以使用同一种语言了.如果您觉得光语言本地了还不够,邮件模板也要本地才行,您可

java指纹识别+谷歌图片识别技术

Google "相似图片搜索":你可以用一张图片,搜索互联网上所有与它相似的图片. 打开Google图片搜索页面: 点击使用上传一张angelababy原图: 点击搜索后,Google将会找出与之相似的图片,图片相似度越高就越排在前面.如: 这种技术的原理是什么?计算机怎么知道两张图片相似呢? 根据Neal Krawetz博士的解释,实现相似图片搜素的关键技术叫做"感知哈希算法"(Perceptualhash algorithm),它的作用是对每张图片生成一个&qu

[半原创]指纹识别+谷歌图片识别技术之opencv代码

先打个广告,哈哈!! 我的新浪微博:http://weibo.com/u/1645794700/home?wvr=5&c=spr_web_360_hao360_weibo_t001 CV机器视觉2013CV机器视觉2013CV机器视觉2013 开始 开始正文吧!!!! 以前看到一个http://topic.csdn.net/u/20120417/15/edbf86f8-cfec-45c3-93e1-67bd555c684a.html网页,觉得蛮有趣的,方法似乎很简单,早就想用c++实现它,但是搁

如何使用迅捷OCR文字识别软件识别提取图中文字

识别提取文字的问题相信是很多小伙伴都经历过的,一般遇到这种问题,很多人都选择了用电脑打字进行转换,这种方法比较的耽误时间,其实除了这种方法我们还有其它的选择,就是通过借助文字识别软件识别提取图片中的文字,具体怎样去操作呢?一起来学习下. 使用工具:电脑 迅捷OCR文字识别软件 实用系数:☆☆☆☆☆ 推荐理由:软件采用先进的OCR识别技术,识别精度高,能够轻松实现文档数字化,操作起来简单易上手. 操作步骤: 步骤一.准备好一张带有文字的图片在电脑中,然后打开文字识别软件,鼠标点击上方图片局部识别板

一种支持本地离线扫描识别的移动端车牌识别技术,基于Android、iOS平台

随着社会的发展,城市中的汽车越来越多.城市由于汽车的增加造成的拥挤给人们的生活带来了极大的不便,这种不便迫使人们去寻找高技术有效手段去解决这种不便.很多的大型停车场收费系统管理存在着排队时间长.管理成本高.劳动强度大等各种弊端,顺应时代发展的一些占路停车场和小型露天停车场也应运而生,然而这些停车场收费透明度低.资金流失和车辆失窃也给车主和管理者造成了较大的困扰,因此需要一些较为快捷有效的管理系统去解决这些问题.此时,一种基于移动端车牌识别的停车收费方法应运而生,车辆通过停车场出入口时,停车场端系