OCR识别要依赖于深度学习的进展吗?

这些年深度学习的出现,让光学字符识别(OCR)技术焕发第二春。现在光学字符识别(OCR)基本都用卷积神经网络来做了,而且识别率也是惊人的好,人们也不再需要花大量时间去设计字符特征了。

在光学字符识别(OCR)系统中,人工神经网络主要充当特征提取器和分类器的功能,输入是字符图像,输出是识别结果,一气呵成。当然用深度学习做光学字符识别(OCR)并不是在每个方面都很优秀,因为神经网络的训练需要大量的训练数据,那么如果我们没有办法得到大量训练数据时,这种方法很可能就不奏效了。其次,神经网络的训练需要花费大量的时间,并且需要用到的硬件资源一般都比较多,这几个都是需要考虑的问题。

在一些简单环境下光学字符识别(OCR)的准确度已经比较高了(比如电子文档),但是在一些复杂环境下的字符识别,在当今还没有人敢说自己能做的很好。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。光学字符识别(OCR)传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。

1) 建立中文资料库 要大量输入各种文书、刊、报及文件,使用光学字符识别(OCR)可以缩短建库时间,减轻劳动强度,降低费用。

2) 办公自动化 工厂企业、公司及事业单位的日常办公用文件及资料等需要输入计算机存储检索。使用光学字符识别(OCR),既比存储图像文件大大地节省存储量,又不需要专职录入人员,是减轻劳动量、节约资金、提高办公效率的最好措施。

3) 机器翻译机器翻译的第一步是将全文输入计算机。利用光学字符识别(OCR)可以将机器自动翻译相匹配,实现高速自动翻译。

4) 图书馆、文献中心 用本系统自动录入图书有关信息,可建立书目数据库自动录入经典图书全文,将纸上文字转移到计算机内,便于保存、查找、检索,更大的好处可以提供给专家用计算机对书籍内容进行研究。

5) 打字公司、书刊出版社、报社等 使用光学字符识别(OCR)可以自动录入已经出版的文章和打印文件,稍加修改编辑成新文章或再版己有书刊。光学字符识别(OCR)输出的标准汉字代码文件可为大多数中文处理系统、轻印刷系统、照排系统所接受,可重新打印、印刷输出。

6) 个人使用 当您阅读资料时,可用光学字符识别(OCR)将您感兴趣的段落自动录入。特别是作家,利用本软件可以将一些书载历史资料或文献快速录入到计算机内。

原文地址:https://www.cnblogs.com/ocr-ai/p/12342103.html

时间: 2024-10-07 06:08:49

OCR识别要依赖于深度学习的进展吗?的相关文章

分享《深度学习、优化与识别》PDF+《深度学习原理与TensorFlow实践》PDF+焦李成

下载:https://pan.baidu.com/s/1xj7GymClcExjn48rPwCowQ 更多资料分享:http://blog.51cto.com/14087171 <深度学习.优化与识别>PDF+<深度学习原理与TensorFlow实践>PDF<深度学习原理与TensorFlow实践>PDF,304页,有目录.<深度学习.优化与识别>PDF,411页,有目录. 如图: 原文地址:http://blog.51cto.com/14087171/23

Dlib+OpenCV深度学习人脸识别

目录(?)[+] DlibOpenCV深度学习人脸识别 前言 人脸数据库导入 人脸检测 人脸识别 异常处理 Dlib+OpenCV深度学习人脸识别 前言 人脸识别在LWF(Labeled Faces in the Wild)数据集上人脸识别率现在已经99.7%以上,这个识别率确实非常高了,但是真实的环境中的准确率有多少呢?我没有这方面的数据,但是可以确信的是真实环境中的识别率并没有那么乐观.现在虽然有一些商业应用如员工人脸识别管理系统.海关身份验证系统.甚至是银行人脸识别功能,但是我们可以仔细想

人脸识别的深度学习

深度学习只不过是机器学习的标准范例,更准确地说 - 是其算法之一.在最大程度上,它基于人脑的概念和神经元的相互作用.如果你开始谷歌搜索深度学习是什么,你会发现今天这个超级热门词远远不是新的.为什么这样?该术语本身出现在20世纪80年代,但到2012年,没有足够的力量来实施这项技术,几乎没有人关注它. 在着名科学家的一系列文章,科学期刊上的出版物之后,这项技术迅速成为病毒.今天,它有各种各样的应用程序,其中重要的地方是人脸识别.首先,深度学习提供了构建识别生物识别软件的能力,该软件能够唯一地识别或

图像识别中的深度学习 转

转:http://mp.weixin.qq.com/s?__biz=MzAwNDExMTQwNQ==&mid=209152042&idx=1&sn=fa0053e66cad3d2f7b107479014d4478#rd#opennewwindow 1.深度学习发展历史 深度学习是近十年来人工智能领域取得的重要突破.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域的应用取得了巨大成功.现有的深度学习模型属于神经网络.神经网络的起源可追溯到20世纪40年代,曾经

当我们谈深度学习时,我们用它落地了什么?

摘要: 近日,阿里云在深度学习方面动作频频,先后发布了OCR证件识别,声纹检测,人脸搜索,视频鉴黄服务以及相似图片搜索功能,下面小编就一一为大家介绍五大功能应用. 现今伴随人工智能在技术上的不断突破,一些领域如计算机视觉,已开始与各个行业进行了深度融合.例如保险行业已通过人脸识别这种新时代的认证方式,来对用户身份信息进行识别与审核.深度学习对人工智能的发展起着至关重要的影响. 近日,阿里云在深度学习方面动作频频,先后发布了OCR证件识别,声纹检测,人脸搜索,视频鉴黄服务以及相似图片搜索功能,下面

深度学习文献阅读笔记(3)

21.深度神经网络在视觉显著性中的应用(Visual Attention with Deep Neural Networks)(英文,会议论文.2015年,IEEE检索) 这篇文章主要讲CNN在显著性检測领域的应用. 22.深度学习研究进展(中文,期刊,2015年.知网) 深度学习方面的一篇综述性文章,对深度学习的由来,人脑视觉机理,CNN结构都有较为具体的描写叙述,并介绍深度学习在今后的主要改进方向. 23.深度学习研究进展(中文,期刊,2014年,知网) 强调一点.就是Hinton等人所做的

(转) 深度学习在目标跟踪中的应用

深度学习在目标跟踪中的应用 原创 2016-09-05 徐霞清 深度学习大讲堂 点击上方“深度学习大讲堂”可订阅哦!深度学习大讲堂是高质量原创内容的平台,邀请学术界.工业界一线专家撰稿,致力于推送人工智能与深度学习最新技术.产品和活动信息! 开始本文之前,我们首先看上方给出的3张图片,它们分别是同一个视频的第1,40,80帧.在第1帧给出一个跑步者的边框(bounding-box)之后,后续的第40帧,80帧,bounding-box依然准确圈出了同一个跑步者.以上展示的其实就是目标跟踪(vis

深度学习库比较

  深度学习库比较 库名 主语言 从语言 速度 灵活性 文档 适合模型 平台 上手难易 开发者 模式 Tensorflo C++ cuda/python 中等 好 中等 CNN/RNN Linux,OSX 难 Google 分布式/声明式 Caffe C++ cuda/python/Matlab 快 一般 全面 CNN 所有系统 中等 贾杨清 声明式 PyTorc python C/C++ 中等 好 中等 - -- 中等 FaceBook   MXNet c++ cuda/R/julia 快 好

(转载)深度学习三十年创新路

转载自:http://36kr.com/p/533832.html 编者注:深度学习火了,从任何意义上,大家谈论它的热衷程度,都超乎想象.但是,似乎很少有人提出不同的声音,说深度学习的火热,有可能是过度的繁荣,乃至不理性的盲从.而这次,有不同的想法出现了. 本篇文章来自依图科技 CEO Leo的投稿,依图科技是一家专注研究CV(Computer Vison,计算机视觉)的以技术驱动的创业公司,Leo自己也在这一领域有深入研究,因此这次写下这篇文章,希望回顾一下深度学习三十年的创新之路. 近期Na