python36图像文字识别安装全过程

1.安装相应库
pip install pytesseract
pip install pillow

2.下载并安装tesseract-ocr
链接:https://pan.baidu.com/s/113o5fIAe94_7autPI4ANiA
提取码:27uh
安装时下拉选择 Chinese(simple),以便对中文支持

3.安装完成后将tesseract-ocr目录(C:\Tesseract-OCR)设置到环境变量中
4.修改pytesseract.py文件中字段
将tesseract_cmd=‘tesseract‘改成
tesseract_cmd = r‘C:\Tesseract-OCR\tesseract.exe‘

5.在pycharm中输入下面代码,查看结果吧
import pytesseract
from PIL import Image,ImageEnhance

image = Image.open(r"C:\Users\Administrator\Desktop\hello2.JPG")
enhancer = ImageEnhance.Contrast(image)
image2 = enhancer.enhance(4)
code = pytesseract.image_to_string(image2,lang="chi_sim+eng")
print(code)

原文地址:https://blog.51cto.com/asura1992/2367789

时间: 2024-08-30 16:53:10

python36图像文字识别安装全过程的相关文章

图像文字识别(OCR)用什么算法小结

说明:主要考虑深度学习的方法,传统的方法不在考虑范围之内. 1.文字识别步骤 1.1detection:找到有文字的区域(proposal). 1.2classification:识别区域中的文字. 2.文字检测 文字检测主要有两条线,两步法和一步法. 2.1两步法:faster-rcnn. 2.2一步法:yolo.相比于两步法,一步法速度更快,但是accuracy有损失. 文字检测按照文字的角度分. 2.1水平文字检测:四个自由度,类似于物体检测.水平文字检测比较好的算法是2016ECCV乔宇

Ng第十八课:应用实例:图片文字识别(Application Example: Photo OCR)

18.1  问题描述和流程图 18.2  滑动窗口 18.3  获取大量数据和人工数据 18.4  上限分析:哪部分管道的接下去做 18.1  问题描述和流程图 图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从一份扫描文档中 识别文字要复杂的多. 为了完成这样的工作,需要采取如下步骤: 1. 文字侦测(Text detection)--将图片上的文字与其他环境对象分离开来 2. 字符切分(Character segmentation)--将文字分割成一个个单一的字符 3. 字符分类

斯坦福第十八课:应用实例:图片文字识别(Application Example: Photo OCR)

18.1  问题描述和流程图 18.2  滑动窗口 18.3  获取大量数据和人工数据 18.4  上限分析:哪部分管道的接下去做 18.1  问题描述和流程图 图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从一份扫描文档中 识别文字要复杂的多. 为了完成这样的工作,需要采取如下步骤: 为了完成这样的工作,需要采取如下步骤: 1. 文字侦测(Text detection)——将图片上的文字与其他环境对象分离开来 2. 字符切分(Character segmentation)——将文

[C13]应用实例:图片文字识别(待整理)

十八.应用实例:图片文字识别(Application Example: Photo OCR) 18.1 问题描述和流程图 参考视频: 18 - 1 - Problem Description and Pipeline (7 min).mkv 图像文字识别应用所作的事是,从一张给定的图片中识别文字.这比从一份扫描文档中识别文字要复杂的多. 为了完成这样的工作,需要采取如下步骤: 文字侦测(Text detection)--将图片上的文字与其他环境对象分离开来 字符切分(Character segm

OCR文字识别软件中怎么把图像转换成HTML

之前给大家介绍了使用OCR文字识别软件ABBYY FineReader Mac版将PDF转换成HTML文档(详见PDF转换成HTML文档首选ABBYY Mac),其实ABBYY FineReader无论Mac版还是Windows版都可以实现这一点,除此之外还可以将图像文件转换成HTML文档,本文具体讲讲这一功能. ABBYY FineReader是一款OCR图文识别软件,当前最新版本为ABBYY FineReader 12,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜

给OCR文字识别软件添加图像的方法

ABBYY FineReader 12是一款OCR图片文字识别软件,而且强大的它现在还可使用快速扫描窗口中的快速打开.扫描并保存为图像或任务自动化任务,在没有进行预处理和OCR的ABBYY FineReader中扫描或打开图像.如果您的文档非常大,而您只需要识别其中的几个页面,就可以派上用场.下面小编将教大家ABBYY FineReader 12添加图像的技巧. 1. 在ABBYY FineReader 12色彩模式下拉列表中,选择全彩色或黑白模式.(注:当文档转换为黑白之后,您不能恢复彩色.)

利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别

利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别 分类: 开放项目2012-07-23 17:28 6712人阅读 评论(0) 收藏 举报 tiffimagecompression引擎pascalcharacter --------------------------------------------------低调的分割线--------------------------------------------------- Linux下有两个重要的编程准则

爬虫——文字识别

机器视觉 从Google的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域. 这里我们将重点介绍机器视觉的一个分支:文字识别.介绍如何用一些Python库来识别和使用在线图片中的文字. 我们可以很轻松的阅读图片里的文字,但是机器阅读这些图片就会非常困难,利用这种人类用户可以正常读取但是大多数存贮器没法读取的图片,这时验证码(CAPTCHA)就出现了.验证码读取的难易程序也大不相同. 将图像翻译成文字一般被称为光学文字识别(Optical Ch

Tesseract-ocr文字识别

当我浏览http://code.google.com/p/tesseract-ocr并下载了几个文件下来之后顿时感到一头雾水,不知该如何下手.网上看到有人在linux操作系统下的实现, 如: 利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别 但却很少看到在windows下的相关文章介绍. 接下来我将一步步讲述如何采用tesseract-ocr识别含有中文的图片. 1.下载tesseract-ocr(注意3.0版本之后才支持中文的识别) tesseract-oc