pytesseract——验证码的识别——PIL库的介绍

1、简介

Python-tesseract是一款用于光学字符识别（OCR）的python工具，即从图片中识别出其中嵌入的文字。Python-tesseract是对Google Tesseract-OCR的一层封装。它也同时可以单独作为对tesseract引擎的调用脚本，支持使用PIL库（Python Imaging Library）读取的各种图片文件类型，包括jpeg、png、gif、bmp、tiff和其他格式，。作为脚本使用它将打印出识别出的文字而非写入到文件。所以安装pytesseract前要先安装PIL和tesseract-orc这俩依赖库

2、安装

PIL 下载地址：https://github.com/lightkeeper/lswindows-lib/blob/master/amd64/python/PIL-1.1.7.win-amd64-py2.7.exe?raw=true

tesseract-ocr下载地址：https://sourceforge.net/projects/tesseract-ocr-alt/files/

然后在cmd 中安装pytesseract

cd C:\Python27\Scripts
pip install pytesseract

3.用pytesseract识别验证码

4.PIL的Image模块

本文是节选自 PIL handbook online 并做了一些简单的翻译

只能保证自己看懂，不保证翻译质量。欢迎各位给出意见。

------------------------------------------------------

Image 模块提供了一个同名类（Image），也提供了一些工厂函数，包括从文件中载入图片和创建新图片。例如，以下的脚本先载入一幅图片，将它旋转 45 度角，并显示出来：

1 >>>from PIL import Image
2 >>>im = Image.open("j.jpg")
3 >>>im.rotate(45).show()

下面这个脚本则创建了当前目录下所有以 .jpg 结尾的图片的缩略图。

Create thumbnail

Image 类中的函数。

0. new : 这个函数创建一幅给定模式（mode）和尺寸（size）的图片。如果省略 color 参数，则创建的图片被黑色填充满，如果 color 参数是 None 值，则图片还没初始化。

new

1. open : 打开并识别所提供的图像文件。不过，使用这函数的时候，真正的图像数据在你进行数据处理之前并没有被读取出来。可使用 load 函数进行强制加载。 mode 参数可以省略，但它只能是 "r" 值。

open

2. blend : 使用两幅给出的图片和一个常量 alpha 创建新的图片。两幅图片必须是同样的 size 和 mode 。

blend

3. composite : 使用两幅给出的图片和一个与 alpha 参数相似用法的 mask 参数，其值可为："1", "L", "RGBA" 。两幅图片的 size 必须相同。

composite

4. eval : 使用带一个参数的函数作用于给定图片的每一个像素。如果给定的图片有超过一个的频段（band），则该函数也会作用于每一个频段。注意，该函数是每一个像素计算一次，所以不能使用一些随机组件或其他的生成器。

eval

5. frombuffer : （PIL 1.1.4 中新添加的）使用标准 "raw" 解码器在像素数据或是对象缓存中创建一个图像副本。不是所有的模式都支持这种用法。支持的 mode 有"L", "RGBX", "RGBA", "CMYK"。

frombuffer

6. fromstring : 注意，这个函数只对像素数据进行解码，而不是一整张图片。如果你有一整张字符串格式的图片，使用 StringIO 对其进行包装并用 open 函数载入它。

fromstring

7. merge : 使用一系列单一频段(band)的图像来创建新的一幅图像。频段是以一些图像组成的元组或列表，所有的 band 必须有相同大小的 size 。

merge

Image 类中的方法：

0. convert : 返回一个转换后的图像的副本。

convert

下面是一个例子：转换 RGB 为 XYZ 。

RGB2XYZ

1. copy : 复制图像。如果你希望粘贴一些东西进图像里面的话可以使用这个方法，但仍然会保留原图像。

copy

2. crop : 返回图像某个给定区域。box 是一个 4 元素元组，定义了 left, upper, right, lower 像素坐标。使用这个方法的时候，如果改变原始图像，可能会，也可能不会改变裁剪生成的图像。创建一个完全的复制，裁剪复制的时候使用 load 方法。

crop

3. draft : 按给出的 mode 和 size 进行配置。可以使用这个方法将彩色JPEG图片转为灰度图。

draft

4. filter : 返回图像使用滤波器后的副本。可以看这里获取更多有用的滤波器。

filter

5. fromstring : 和前面的函数是一样的功能，不过这个方法是将数据载入到当前图像。

fromstring

6. getbands : 返回一个元组，包含每一个 band 的名字，比如，在一幅 RGB 格式的图像上使用 getbands 则返回（"R", "G", "B"）。

getbands

7. getbbox : 计算图像边框值，返回一个 4-元组，值为（左，上，右，下）。

getbbox

8. getcolors : 在 1.1.5 版本中新添加的。返回一个未排序列表，其元素是元组（count, color）。the count is the number of times the corresponding color occurs in the image 。If the maxcolors value is exceeded, the method stops counting and returns None。

getcolors

9. getdata : 返回一个图像内容的像素值序列。不过，这个返回值是 PIL 内部的数据类型，只支持确切的序列操作符，包括迭代器和基本序列方法。我们可以通过 list(im.getdata()) 为其生成普通的序列。

getdata

10. getextrema : 返回一个 2-元组，值为图像的最小最大值。在当前PIL版本中，仅支持单一频段(single-band)的图像。

getextreme

11. getpixel : 返回指定位置的像素，如果所打开的图像是多层次的图片，那这个方法就返回一个元组。

getpixel

12. histogram : 返回图像直方图，值为像素计数组成的列表。如果有参数 mask ，则返回图像所有部分的直方图。

histogram

13. load : 版本 1.1.6 新添加的。load 返回对象的像素值，可以用来修改像素值。

load

14. paste : 1). 粘贴新图片至图片中，box 参数可以为 2-元组（upper, left）或是 4-元组（left, upper, right, lower），或者是 None（0, 0）。2). 功能同上。不过是将指定位置填充为某种颜色。

paste

15. point :

时间： 2024-10-08 09:11:49

pytesseract——验证码的识别——PIL库的介绍

1、简介

2、安装

pytesseract——验证码的识别——PIL库的介绍的相关文章

python-使用内置库pytesseract实现图片验证码的识别

纯代码系列：Python实现验证码图片(PIL库经典用法用法，爬虫12306思路)

简单验证码的识别

Python常用的库简单介绍一下

Python3网络爬虫实战-45、微博宫格验证码的识别

python PIL库回顾

python，使用PIL库对图片进行操作

python PIL库回顾1

安装PIL库