图片文字识别

OCR引擎

OCR（Optical Character Recognition）是指使用扫描仪或数码相机对文本资料进行扫描成图像文件，然后对图像文件进行分析处理，自动识别获取文字信息及版面信息的软件。

OCR引擎核心技术模块主要是由下面几个部分组成：

图像输入：读取不同图像格式文件的算法。

图像预处理：主要包括图像二进制化，噪声去除，倾斜较正等算法

版面分析：将文档图片分段落，分行的算法就叫版面分析算法

字符切割：字符切割算法主要处理因字符粘连、断笔造成字符难以简单切割的问题。

字符特征提取：对字符图像提取多维的特征用于后面的特征匹配模式识别算法。

字符识别：将当前字符提取的特征向量与特征模板库进行模板粗分类和模板细匹配，识别出字符的算法。

版面恢复：识别原文档的排版，按原排版格式将识别结果输出到word或pdf等格式文档，叫做版面恢复算法。

后处理校正：根据特定的语言上下文的关系，对识别结果进行较正的算法。

其中，对于.Net来说三种比较主流和成熟的识别方式：

方式一、Asprise OCR实现。其中需要使用的3个dll是AspriseOCR.dll、DevIL.dll、ILU.dll。其数字识别率比较高，

示例代码：

[DllImport("AspriseOCR.dll")]
  static extern string craboOCR(string file, int type);
private void GetVeryfyCode()
  {
if(File.Exists(_imgPath))//ok
   {
    try
    {
    this.picbVeryfyCode.Image=System.Drawing.Bitmap.FromFile(_imgPath);
     _veryfyCode=craboOCR(_imgPath,-1);   //将返回string,并以"\r\n"结尾!!
     _veryfyCode=_veryfyCode.Substring(0,4);
     this.txtVeryfyCode.Text=_veryfyCode;
    }
    catch(Exception e)
    {
     this.lblResult.Text+=e.Message;
    }
   }
}

方式二、Microsoft Office Document Imaging（Office 2007）组件实现。

方式三、Tesseract引擎，其.NET版本地址为：http://www.pixel-technology.com/freeware/tessnet2/。其中在使用前要对该引擎进行安装，安装成功后可以对其Dos命令行进行封装，

调用命令形式如下：

 private void UseOCR(string v_strTesseractPath, string v_strSourceImgPath, string v_strOutputPath, string v_strLangPath)
        {
            using (Process process = new System.Diagnostics.Process())
            {
                process.StartInfo.FileName = v_strTesseractPath;
                process.StartInfo.Arguments = v_strSourceImgPath + " " + v_strOutputPath + " -l " + v_strLangPath;
                process.StartInfo.UseShellExecute = false;
                process.StartInfo.CreateNoWindow = true;
                process.StartInfo.RedirectStandardOutput = true;
                process.Start();
                process.WaitForExit();
            }
        }

时间： 2024-11-02 18:47:09

图片文字识别的相关文章

斯坦福第十八课：应用实例：图片文字识别(Application Example: Photo OCR)

18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:哪部分管道的接下去做 18.1 问题描述和流程图图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从一份扫描文档中识别文字要复杂的多. 为了完成这样的工作,需要采取如下步骤: 为了完成这样的工作,需要采取如下步骤: 1. 文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来 2. 字符切分(Character segmentation)——将文

『方案』《女友十年精华》 ORC 图片文字识别详解

目的需求: 2008年,遇到一本电子书 <女友十年精华> 觉得很美,想私藏这些文章: >网络搜索文章 —— 没有找到: >反编译程序 —— 所有文字都是图片格式(部分文章的非规律乱码即为证明,且试用 Adobe Director 反编译确是图片无疑) >总计 310篇文章 —— 如何降低工作复杂度得到文本格式的文章? 最后方案: >写区域截屏软件,将一篇文章截成多图 (图片文字行有重复): >过滤文章多图的背景图片(背景图片会干扰 O

Python人工智能之图片识别，Python3一行代码实现图片文字识别

1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包注意: 原文地址:https://www.cnblogs.com/jycjy/p/8799295.html

PDF图片文字识别的实现方法

怎么识别PDF图片中的文字呢?相信很多人都在为这个问题而困扰吧.那么,下面我就来给大家讲解一下如何实现PDF图片文字识别吧. 步骤一:打开电脑浏览器,下载并运行捷速OCR文字识别软件. 步骤二:打开捷速0CR文字识别软件,点击退出按钮,退出该选项. 步骤三:点击软件正上方"高级识别"按钮. 步骤四:随后选择软件左上方"添加"按钮,将自己需要编辑的PDF文件添加进来. 步骤五:文件添加后点击软件上方的"内容解析"按钮,那么软件就会自动对文件进行内容

用图片文字识别软件复制微信小助手的开票信息

微信目前有开票小助手的功能,可以保存开票信息,客户经常会发微信开票小助手里的截图,附带有个二维码,这边可以扫描二维码获取抬头,虽然听说有用二维码极速开票的,对于这个不清楚,也不打算了解,本人还是用的传统方式,开票信息也不算多,最多也就四条.刚开始的时候,如果客户发这种图,我会直接对照着手打,因为数据不是很多,如果不是很忙,没有其他事情,下单的时候还没给快递打电话,手打之后在一个个对照一下,确认后打出来,再对照一下,也没什么问题.后来,客户由于有时候下午下单,时间有时候比较晚,已经给顺丰打电话了,

如何简单的实现图片文字识别

不知道有没有人和小编一样,经常需要文字识别,那这个时候有什么简单的方法可以帮助解决这个问题呢? 辅助工具:电脑迅捷OCR文字识别软件实用系数:☆☆☆☆☆ 推荐理由:该软件是一款智能化的OCR图片文字识别软件,支持PDF识别.扫描件识别.图片文字识别.CAJ识别.票证识别.图片局部识别等功能,快速解析.精准识别. 操作步骤: 1:将电脑中的文字识别软件打开,在上方导航栏选择图片局部识别板块. 2:接着点击添加文件按钮将所需识别的图片添加进来. 3:在界面左下角这里更改一下文件的保存位置,方便识

python之图片文字识别

总体思路: 1.借用热键截图,保存到本地 2.用百度的图片文字识别api,识别图中文字 import time import keyboard # 监控键盘事件pip install keyboard from PIL import ImageGrab # 能够去从剪切板当中把图片读取出来pip install pillow from aip import AipOcr #百度文字识别库 pip install baidu-aip # 上面的都是扩展包, 得安装 pip install pill

职场专业图片文字识别的方法，你知道吗

在职场中又一个专业的图片文字识别方法,工作不是经常整理图片文字的员工不知道,那就是使用一下专业的OCR文字识别软件,在加上专业的操作方法,就可以快速的把图片上的文字识别出来了.在平时生活中实现图片文字识别的方法不是很好用,而且操作步骤很繁琐,下面小编就分享一个专业的图片文字识别方法.工具和原料:1:带有文字的图片:2:OCR文字识别工具.操作方法:第一步:[打开OCR软件]:在电脑上打开文字识别软件,大家可以通过浏览器搜索关键词"迅捷OCR文字识别软件"找到OCR软件.第二步:[极速识

使用电脑实现图片文字识别的方法

电脑是我们常用的办公工具之一,在职场中,唯独不可缺少的就是电脑,整理一些文件和处理一些工作,我们都需要在电脑上进行,那么我们如何在电脑上实现图片文字识别呢,知道方法的人很简单,只需要在电脑上准备一个工具,便可以轻松的完成,下面小编分享一个简单而又高效的方法.使用工具:迅捷OCR文字识别工具:操作方法:第一步:在电脑上运行OCR文字识别软件,不知道在哪下的朋友,可以打开百度或者是软件管家上面下载: 第二步:点击左边功能栏中的极速识别功能,进入图片文字识别界面:第三步:点击上面的添加文件按钮,将需要

快速实现图片文字识别的步骤

进行图片文字识别,相信大家都知道,在工作中我们经常会收到上级给我们的文件,其中肯定是有图片文件的,面对整理图片信息大家的方法是什么呢?下面小编就给大家介绍一个简单图片文字识别的步骤,以后再实现图片文字识别的时候,再也不用打字的方式实现了.使用工具:迅捷OCR文字识别工具:操作方法:快速实现图片文字识别的步骤进行图片文字识别,相信大家都知道,在工作中我们经常会收到上级给我们的文件,其中肯定是有图片文件的,面对整理图片信息大家的方法是什么呢?下面小编就给大家介绍一个简单图片文字识别的步骤,以后再实现