OCR 即光学字符识别

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent
Character
Recognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

OCR开发包:

http://www.oschina.net/project/tag/262/ocr

http://blog.sina.com.cn/s/blog_456baf5e01015wow.html

http://www.cnblogs.com/stone_w/archive/2011/10/08/2202397.html

http://asprise.com/product/ocr/download.php?lang=csharp

tesseract-ocr

https://code.google.com/p/tesseract-ocr/

https://code.google.com/p/tesseractdotnet/

http://www.pixel-technology.com/freeware/tessnet2/

https://github.com/charlesw/tesseract

http://vietocr.sourceforge.net/training.html

http://sourceforge.net/projects/vietocr/files/?source=navbar

时间： 2024-08-06 03:40:55

OCR 即光学字符识别的相关文章

Ocrad.js – JS 实现 OCR 光学字符识别

Ocrad.js 相当于是 Ocrad 项目的纯 JavaScript 版本,使用 Emscripten 自动转换.这是一个简单的 OCR (光学字符识别)程序,可以扫描图像中的文字回文本. 不像 GOCR.js,Ocrad.js 被设计成一个端口,而不是围绕可执行的包装.这意味着后续的图像处理,并不涉及重新初始化可执行代码,以便处理图像尽可能少的进行,因此它需要的时间仅为 GOCR.js 的八分之一. 在线演示立即下载您可能感兴趣的相关文章网站开发中很有用的 jQuery 效果

开源OCR光学字符识别

纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成.而过去几年,无纸化办公的概念发生了显着的转变.在计算机软件的帮助下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存.扫描文档的好处不纯粹是存档理由.为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要.选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但可能存在隐私问题和文件大小限制. OCR软件非大众产品,因此开源替代相对于商业级重量级产品相对较少,

移动端车牌识别，OCR光学字符识别技术

移动端车牌识别技术,是在OCR光学字符识别技术的基础上研发的用来识别汽车号牌特征信息的图像识别技术.在国内,该项技术由北京易泊时代携手清华大学成功地将"国家863计划"项目成果--"文字图像识别技术TH-OCR"产业化,真正实现了TH-OCR技术与市场应用的完美结合. 一.移动端车牌识别应用背景随着我国警务通.停车场手持收费机等移动终端的使用越来越普及,车辆越来越多,对车的管理要高效也是必然的,如果在这些终端上能够集成车牌识别功能,必然省时省力,对于维护交通安全和

非黑即白--谷歌OCR光学字符识别

#非黑即白--谷歌OCR光学字符识别颜色的世界里,非黑即白.computer表示深信不疑. 今天研究一下前沿技术OCR光学识别庞大领域中的众多分支里的一个开源项目的一个包-tesseract. 能让机器识别图片是无数工程师梦寐以求的事任何物体只有成功转为二进制才有可能被机器识别,而识别是做出一系列智能行为的前提下面以一张验证码为例梳理一下机器识别的思路: 准备工作: 1.取到图片地址,在线转化为图片流或者下载到本地 2.PIL, pytesseract 两个包,其实主要用他们中各一个函数,

6 个优秀的开源 OCR 光学字符识别工具

纸张在许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成.而过去几年,无纸化办公的概念发生了显着的转变.在计算机软件的帮助下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存.扫描文档的好处不纯粹是存档理由.为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要.选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但可能存在隐私问题和文件大小限制. OCR软件非大众产品,因此开源替代相对于商业级重量级产品相对较少,

IT行业新名词--透明手机 OCR(光学字符识别) 夹背电池

透明手机机身设计的一大关键部分是可替换玻璃的使用,利用导电技术,在看不到线路的环境下,让LED发光. 这种玻璃内含液晶分子,对于内容的显示则是通过电流对分子的刺激来实现.当手机断电后,分子位置会随机分布,并呈现出乳白色的外观. 透明手机的设计特点概括起来有: 1.体积小.厚度约0.5公分,和iPhone5相比,屏幕4.3英寸,重量轻25%. 2.强化防摔,即使重重的摔在地上也不会支离破碎. 3.单面触控,但能双面显示. 4.电池.麦克风和microSD卡槽都位于手机的底部,这些部件因暂无法实现

OCR光学字符识别技术，改变传统工作模式

自2015年以来,国内"三证合一"登记制度改革如火如荼的进行,国务院.有关部门及税务总局陆续下发了一系列文件,对"三证合一"改革有关工作做出了详细部署并提出了明确要求.到2015年底全国发出了350.94万张"三证合一"的营业执照,已取得显著效果.同时伴随着企业实名制验证等问题也随之而来,因此也衍生出一些软件代替人去识别证件内的信息并将信息提取出来. OCR光学字符识别技术是基础--针对移动互联网数据采集业务推出了OCR识别软件,例如可以识别营业

OCR光学字符识别技术是AI人工智能的基础

现在很多款手机软件都集成了OCR光学字符识别技术(Optical Character Recognition),可以通过手机拍照或摄像头扫描,就可自动识别并提取出所拍摄图像中的数据信息,比如:当我在看英语书的时候,遇到不懂的单词或想直接知道该段英文的翻译,那么可以直接使用手机上集成了OCR的自动识别软件,进行拍照识别或是扫描识别,然后会直接给出识别结果,识别准确率也很高. 这种集成了OCR的识别技术,被成为文字识别OCR技术. 目前,文字识别技术应用在教育教学.报纸报刊.图书馆.新闻媒体等领域,

光学字符识别OCR

光学字符识别(Optical Character Recognition,OCR),是指将图像上的文字转化为计算机可编辑的文字内容. 分析流程: 作为OCR系统的第一步,特征提取是希望找出图像中候选的文字区域特征,以便我们在第二步进行文字定位和第三步进行识别.在这部分内容中,我们集中精力模仿肉眼对图像与汉字的处理过程,在图像的处理和汉字的定位方面走了一条创新的道路.这部分工作是整个OCR系统最核心的部分,也是我们工作中最核心的部分. 传统的文本分割思路大多数是"边缘检测 + 腐蚀膨胀 + 联通

猜你喜欢

Linux系统对分区的基本要求及企业生产场景中的分区方案

Linux系统对分区的基本要求 1. 最少要有一个根(/)分区,用来存放系统文件及程序,其大小至少在5GB\以上. 2. 要有一个swap(交换)分区,它的作用相当于Windows系统里的虚拟 ...

android:clipChildren属性的分析——是否剪裁子View

MainActivity如下: package cc.testclipchildren; import android.os.Bundle; import android.app.Activity; ...

学习资源（二）

最近在微博中发现MOOC上有了Python的教程,出于兴趣就打算简单的听一听了解一下,今天听了第一期的讲座,老师讲的非常形象,大家有兴趣可以去看一看 https://class.coursera.or ...

印度与巴基斯坦比赛试射导弹印度连续失败4次i9

此外,内塔尼亚胡承认收受法国大亨曼朗的政治献金.内塔尼亚胡办公室称,他在2001年收取曼朗4万美元献金,并拨入公共事务基金,用途包括出国推广以色列,但内塔尼亚胡当时未有担任公职.曼朗其后因在碳排放额交 ...

1128项目跟进

跟进结果: 经过这几天我们组的成员反复讨论,反复修改,每个人各司其职,终于也把订餐系统的登录界面功能实现,界面虽然并不是特别美观,但后续相信会有更好的改进. 在这一功能中,我们实现用户的登录,还有用户 ...

软考试题分析

软件设计师下午最后一题分析: namespace ConsoleApplication { #region 2016软考下半年下午最后一题 class Invoice { public virtual ...

收集了一些python的文章

来自: 戴铭 2010-08-31 17:52:31 newthreading - safer concurrency for Python 安全并发(1回应) http://www.starming ...

自然数从1到n之间,有多少个数字含有1

问题明确而简单.for循环肯定是不好的. 用递推方法: 定义h(n)=从1到9999.....9999 ( n 个 9)之间含有1的数字的个数.定义f(n)为n位数中 ...

Js中的splite,join,

1. 1) join() 方法用于把数组中的所有元素放入一个字符串. 元素是通过指定的分隔符进行分隔的. 指定分隔符方法join("#");其中#可以 ...

很强大的shell写的俄罗斯方块

网上看到的一个用linux的shell脚本写的俄罗斯方块. 是我至今见过写的最牛逼的shell了.共享一下. 原作者信息在脚本的凝视中有. 下载地址:点击下载 #!/bin/bash # Tetris ...

Redis工业生产应用场景

Redis应用场景国内外三个不同领域巨头分享的Redis实战经验及使用场景 Redis的5个常见使用场景 Redis应用场景 Redis应用场景<张善友>

聊天内容3.2 浏览器

typeof document.all 就是undefined console一下 document.all 就是一堆HTML ie下document.all就是true,其他就是false,可用来判 ...

foreach遍历扩展（二）

一.前言假设存在一个数组,其遍历模式是根据索引进行遍历的:又假设存在一个HashTable,其遍历模式是根据键值进行遍历的:无论哪种集合,如果它们的遍历没有一个共同的接口,那么在客户端进行调用的时候 ...

（1）无废话JQuery之通用模板

通用模板: <head> <script src="JS/jquery-1.9.1.min.js" type="text/javascript" ...

不以物喜不以己悲

岳阳楼记范仲淹庆历四年春,滕子京谪守巴陵郡.越明年,政通人和,百废具兴,乃重修岳阳楼,增其旧制,刻唐贤今人诗赋于其上.属予作文以记之. 予观夫巴陵胜状,在洞庭一湖.衔远山,吞长江,浩浩汤汤,横无际 ...

HDU1896 优先队列2

D - 优先队列入门2 Time Limit:3000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Submit ...

HTTP（二）代理

代理概念 Web上的代理服务器是代表客户端完成事务处理的中间人. HTTP代理服务器既是Web服务器又是Web客户端. 分类公共代理和私有代理与网关的区别代理连接的是两个或多个使用相同协议的应 ...

正则表达式 \b （转）

引用网上一段话: \b 是正则表达式规定的一个特殊代码(好吧,某些人叫它元字符,metacharacter),代表着单词的开头或结尾,也就是单词的分界处.虽然通常英文的单词是由空格,标点符号或者换行来 ...

如何：从 bool? 安全地强制转换为 bool（C# 编程指南）

bool? 可以为 null 的类型可以包含三个不同的值:true.false 和 null.因此,bool? 类型不能用于条件语句,如 if.for 或 while.例如,此代码无法编译,并将报告编 ...

使用正则移除尖括号<>中的指定子字符串

string search = "1311160122251"; string input = "dfsdfsd<在OA中申请Annual Leaveaaaa公司年 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.