爬虫(十三):PIL模块

1. PIL模块

爬虫(十二):图形验证码的识别、滑动验证码的识别(B站滑动验证码)中我留下了一个悬念,为什么安装的是pillow模块,而不是PIL模块。这是因为PIL是python2的产物,它并没有跟随python的发展而发展。所以有大佬为此特意写了一个针对python3的pillow模块。所以,如果需要安装python3对应的PIL,应该选择安装pillow。

1.1 导入Image模块

我们一般只使用PIL模块中的Image模块,所以我这就只讲解Image模块了。

安装PIL模块:

pip install pillow -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

导入模块:

from PIL import Image

1.2 Image模块常用方法

(1) 读取图片

open(url):读取一张图片,参数是图片名。

(2) 显示图片

show():显示一张图片。

案例:

from PIL import Image

img = Image.open(‘xhh.jpg‘)
img.show()

结果:

(3) 保存图片

save(image,type):将图像保存为名称为“image”、格式为type格式的图片。

(4) 创建新图片

new(mode,size):创建一张模式为mode、大小为size的图片。

new(mode,size,color):创建一张模式为mode、大小为size、颜色为color的图片。

案例:

from PIL import Image

newImg = Image.new("RGBA",(640,480),(255,0,0))
newImg.save("newImg.png","PNG")

结果:

(5) 两张图片相加

blend(img1,img2,alpha):将img1和img2,这里alpha表示img1和img2的比例参数

(6) 改变图像大小

resize(size):将图像修改为size大小

案例1:

from PIL import Image

img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
#img = img1×0.8+img2×0.2
img = Image.blend(img1,img2,0.2)
img.show()

结果:

为什么会报错呢?因为他们的大小不一样,而这个报错在官方是没有解释的。

案例2:

from PIL import Image

img1 = Image.open("xhh.jpg")
img1 = img1.resize((256,256))
img2 = Image.open("xhh2.jpg")
img2 = img2.resize((256,256))
#img = img1×0.7+img2×0.3
img = Image.blend(img1,img2,0.3)
img.show()

结果:

(7) 点操作

point(function):这个function接受一个参数,且对图片中的每一个点执行这个函数。

案例:

from PIL import Image

img = Image.open("xhh.jpg")
img.show()
out=img.point(lambda i:i*1.5)#对每个点进行50%的加强
out.show()

这前后对比明显吧。

(8) 查看图像信息

from PIL import Image

img = Image.open("xhh.jpg")
print(img.format)
print(img.size)
print(img.mode)

结果:

(9) 图片裁剪

crop(box):设置要裁剪的区域范围box。

案例:

from PIL import Image

img = Image.open("xhh.jpg")
box=(100,100,500,500)
#设置要裁剪的区域
region=img.crop(box) #此时,region是一个新的图像对象。
region.show()

结果:

(10) 图像黏贴(合并)

paste(region,box):黏贴box大小的region图像到原来的图片对象中。

案例:

from PIL import Image

img1 = Image.open("xhh.jpg")
img2 = Image.open("xhh2.jpg")
img1.paste(img2,(0,0))
img1.show()

结果:

(11) 通道分离

split():分割成三个通道,此时r,g,b分别为三个图像对象。

(12) 通道合并

merge("RGB",(b,g,r)):将b,r两个通道进行翻转。

案例:

from PIL import Image

img1 = Image.open("xhh.jpg")
img1.show()
r, g, b = img1.split()
img2 = Image.merge("RGB", (b, g, r))
img2.show()

结果:

(13) 旋转图像

rotate(angle):逆时针旋转angle度。

(14) 图像转换

案例:

from PIL import Image

img = Image.open("xhh.jpg")
#左右对换
out1 = img.transpose(Image.FLIP_LEFT_RIGHT)
out1.show()
#上下对换
out2 = img.transpose(Image.FLIP_TOP_BOTTOM)
out2.show()

结果:

(15) 图像类型转换

convert(mode):将图像转换成mode类型。

PIL的九种不同模式:1,L,P,RGB,RGBA,CMYK,YCbCr,I,F。

常用的两种:

1.模式”1”
为二值图像,非黑即白。但是它每个像素用8个bit表示,0表示黑,255表示白。下面我们将lena图像转换为“1”图像。
from PIL importImage
img = Image.open(“E:\image\myimg.jpg”)
img_1=img.convert(“1”)
2.模式“L”
为灰色图像,它的每个像素用8个bit表示,0表示黑,255表示白,其他数字表示不同的灰度。在PIL中,从模式“RGB”转换为“L”模式是按照下面的公式转换的:
L = R * 299/1000 + G * 587/1000+ B * 114/1000

(16) 获取某个像素位置的值

getpixel(coordinate):coordinate为(x,y)形式的值。

(17) 修改某个像素位置的值

putpixel(coordinate,color):修改像素位置coordinate的颜色color的值。

案例:

from PIL import Image

img = Image.open("xhh.jpg")

print(img.size)
print(img.getpixel((4, 4)))

width = img.size[0]  # 长度
height = img.size[1]  # 宽度

for w in range(0, width):
    for h in range(0, height):
        data = img.getpixel((w, h))  # 得到像素值
        if (data[0] <= 170 and data[1] <= 170 and data[2] <= 170):
            img.putpixel((w, h), (0, 0, 255))  # 则这些像素点的颜色改成大红色

img.show()

结果:

原文地址:https://www.cnblogs.com/liuhui0308/p/12099467.html

时间: 2024-08-03 05:18:39

爬虫(十三):PIL模块的相关文章

第三百二十三节,web爬虫,scrapy模块以及相关依赖模块安装

第三百二十三节,web爬虫,scrapy模块以及相关依赖模块安装 当前环境python3.5 ,windows10系统 Linux系统安装 在线安装,会自动安装scrapy模块以及相关依赖模块 pip install Scrapy 手动源码安装,比较麻烦要自己手动安装scrapy模块以及依赖模块 安装以下模块 1.lxml-3.8.0.tar.gz (XML处理库) 2.Twisted-17.5.0.tar.bz2 (用Python编写的异步网络框架) 3.Scrapy-1.4.0.tar.gz

第三百二十四节,web爬虫,scrapy模块介绍与使用

第三百二十四节,web爬虫,scrapy模块介绍与使用 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 其可以应用在数据挖掘,信息处理或存储历史数据等一系列的程序中.其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的, 也可以应用在获取API所返回的数据(例如 Amazon Associates Web Services ) 或者通用的网络爬虫.Scrapy用途广泛,可以用于数据挖掘.监测和自动化测试. Scrapy 使用了 Twisted异步网络库来处理网络通讯.

python爬虫主要就是五个模块:爬虫启动入口模块,URL管理器存放已经爬虫的URL和待爬虫URL列表,html下载器,html解析器,html输出器 同时可以掌握到urllib2的使用、bs4(BeautifulSoup)页面解析器、re正则表达式、urlparse、python基础知识回顾(set集合操作)等相关内容。

本次python爬虫百步百科,里面详细分析了爬虫的步骤,对每一步代码都有详细的注释说明,可通过本案例掌握python爬虫的特点: 1.爬虫调度入口(crawler_main.py) # coding:utf-8from com.wenhy.crawler_baidu_baike import url_manager, html_downloader, html_parser, html_outputer print "爬虫百度百科调度入口" # 创建爬虫类class SpiderMai

PIL模块与随机生成中文验证码

今天我们要学习的内容是如何利用Python生成一个随机的中文验证码,并将图片保存为.jpeg格式. 在这之前,你首先得了解Python中的PIL库.PIL是Python Imaging Library的简称,PIL是一个Python处理 图片的库,提供了一系列模块和方法,比如:裁切,平移,旋转,改变尺寸等等.在PIL库中,任何一个图像都是用 Image对象来表示的,所以要加载一张图片,最简单的形式如下: from PIL import Image image = Image.open("1.jp

python 使用Django Simple Captcha之缺少PIL模块

需要安装PIL模块: yum install python-devel yum install libjpeg libjpeg-devel zlib zlib-devel freetype freetype-devel lcms lcms-devel yum install python-imaging

爬虫之request模块

爬虫之request模块 request简介 #介绍:使用requests可以模拟浏览器的请求,比起之前用到的urllib,requests模块的api更加便捷(本质就是封装了urllib3) #注意:requests库发送请求将网页内容下载下来以后,并不会执行js代码,这需要我们自己分析目标站点然后发起新的request请求 #安装:pip3 install requests #各种请求方式:常用的就是requests.get()和requests.post() >>> import

Python爬虫教程-09-error 模块

Python爬虫教程-09-error模块 今天的主角是error,爬取的时候,很容易出现错,所以我们要在代码里做一些,常见错误的处,关于urllib.error URLError URLError 产生的原因: 1.无网络连接 2.服务器连接失败 3.找不到指定的服务器 4.URLError是OSError的子类 案例v9文件:https://xpwi.github.io/py/py%E7%88%AC%E8%99%AB/py09error.py # 案例v9 # URLError的使用 fro

python PIL 模块

最近看了下PIL模块,看了下别人是如何生成验证码数据集 参考 https://www.cnblogs.com/tsboy/p/8862707.html import random from PIL import Image from PIL import ImageDraw from PIL import ImageFont def RandomColor(): c1 = random.randint(0,255) c2 = random.randint(0,255) c3 = random.r

Python使用PIL模块生成随机验证码

PIL模块的安装 pip3 install pillow 生成随机验证码图片 import random from PIL import Image, ImageDraw, ImageFont from io import BytesIO def random_str(): ''' 生成随机字符 :return:随机字符 ''' random_int = str(random.randint(0,9)) random_up = chr(random.randint(65,90)) random_