Python图片识别——人工智能篇

一、安装pytesseract和PIL

   PIL全称:Python Imaging Library,python图像处理库,这个库支持多种文件格式,并提供了强大的图像处理和图形处理能力。

   由于PIL仅支持到Python 2.7,所以在PIL的基础上创建了Pillow库,支持最新Python 3.x。

  1、pip命令安装

    pip install pytesseract

    pip install Pillow

  2、使用pycharm编辑器安装,如下操作步骤。

  安装成功:

  安装pytesseract时,同时安装pillow,所以我们只需安装pytesseract即可。

  3.尝试运行,出现报错,如下图,原因:没有安装识别引擎tesseract-ocr

二、安装识别引擎tesseract-ocr

  1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别,经过改进引擎和训练系统,它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符,但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言(比如中文)上较慢,但是工作良好。

  下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

  因为tesseract-ocr默认不支持中文识别。

   将下载到的文件:chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下,如图:

  2,安装完成tesseract-ocr后,需要做一下配置 。

    在Python安装目录(如:D:\Python35\Lib\site-packages\pytesseract) 中修改 pytesseract.py文件。

    也可以通过pycharm,Ctrl+B 快速打开pytesseract源码文件:

  3.尝试运行,出现如下报错:pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language \‘chi_sim\‘ Tesseract couldn\‘t load any languages! Could not initialize tesseract.‘)

  4.解决方法:将tessdata目录的上级目录所在路径:(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中,如下图:

    注意:配置完环境变量需要重新打开pycharm编辑器(IDE)。

  5.测试结果:图片识别成功!

  但识别率不是很高,后期再调教。

原文地址:https://www.cnblogs.com/lizhe860/p/8969171.html

时间: 2024-10-06 00:11:02

Python图片识别——人工智能篇的相关文章

Python图片识别找坐标(appium通过识别图片点击坐标)

***如果只想了解图片相似度识别,直接看第一步即可 ***如果想了解appium根据图片识别点击坐标,需要看第一.二.三步 背景|在做UI测试时,发现iOS自定义的UI控件,appium识别不到.所以考虑通过识别图片找坐标,进而通过点击坐标解决问题 依赖python包|opencv.numpy.aircv 第一步:查找图片在原始图片上的坐标点 import aircv as ac def matchImg(imgsrc,imgobj,confidencevalue=0.5):#imgsrc=原始

Python系列课程——人工智能篇简单入门

1.基础篇--基于Python的机器学习>>>>>>戳我,立即学习     现在大热.为未来计算机科学发展方向的机器学习了解多少呢? 下面推荐的这个内容比较适合小白,如果数学.模型理论基础不扎实也没关系,可以掌握Python编程语言基本可以轻松学习~ 例如利用Python编程语言实现线性分类器.支持向量机.朴素贝叶斯等经典机器学习模型来解决诸如肿瘤良恶性预测.手写体识别.泰坦尼克号生还预测等实际问题.并就模型本身泛化力问题(过拟合.欠拟合)进行讨论与实验,可以更快的解决

python 图片识别灰度

# -*- coding: cp936 -*- from skimage import io,transform,color import numpy as np def convert_gray(f,**args):#图片处理与格式化的函数 rgb=io.imread(f) #读取图片 gray=color.rgb2gray(rgb) #将彩色图片转换为灰度图片 dst=transform.resize(gray,(48,90)) #调整大小,图像分辨率为64*64 return dst da

python 图片识别

安装库pip install pytesseract pip install Pillow windows安装 tesseract 中文识别下载地址:https://digi.bib.uni-mannheim.de/tesseract/运行安装:tesseract-ocr-setup-4.00.00dev.exe安装路径:C:\Anaconda3\Tesseract-OCR安装完成后设置环境变量1.添加环境变量2.添加系统变量重启 from PIL import Imageimport pyte

Python人工智能之图片识别,Python3一行代码实现图片文字识别

1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包 注意: 原文地址:https://www.cnblogs.com/jycjy/p/8799295.html

【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇四:关于OneNote入库处理以及审核

篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblogs.com/baiboy/p/wpf1.html 篇三:批量处理后的txt文件入库处理:http://www.cnblogs.com/baiboy/p/wpf2.html 篇四:关于OneNote入库处理以及审核:http://www.cnblogs.com/baiboy/p/wpf3.html [

【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇三:批量处理后的txt文件入库处理

篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblogs.com/baiboy/p/wpf1.html 篇三:批量处理后的txt文件入库处理:http://www.cnblogs.com/baiboy/p/wpf2.html 篇四:关于OneNote入库处理以及审核:http://www.cnblogs.com/baiboy/p/wpf3.html [

python实现百度OCR图片识别

一.直接上代码 import base64 import requests class CodeDemo: def __init__(self,AK,SK,code_url,img_path): self.AK=AK self.SK=SK self.code_url=code_url self.img_path=img_path self.access_token=self.get_access_token() def get_access_token(self): token_host = '

CoreML试水--图片识别

今年的WWDC上,关于人工智能方面Apple开放了CoreML工具包. 今天就趁着时间还早果断的尝试了一下到底有多容易. import UIKit import CoreML import Vision 首先头文件里CoreML和Vision两个新的包都需要引入. 如果只是模仿Apple官方给出的模型可以不使用Vision包,但是如果要做图片识别那么最好使用Vision的方法.(原因之后会提到) @IBAction func openLibrary(_ sender: Any) { if UII