Pytorch读取,加载图像数据(一)

在学习Pytorch的时候,先学会如何正确创建或者加载数据,至关重要。

有了数据,很多函数,操作的效果就变得很直观。

本文主要用其他库读取图像文件(学会这个,你就可以在之后的学习中,将一些效果直观化)

更好的文章组织结构:

  • Github
  • 关注公众号:tuduisuinian(土堆碎念),菜单底部可以获取pytorch教程PDF文档

零:准备

加载数据前,需要掌握正确的读取路径方法。很多教程中的例子,在讲解的时候,没有提供图片,或者读者不知道修改教程中的读取路径,打击了热情。

建议:为了保证大家可以跟着教程一步一步练习,教程中会出现示例图片,建议大家右键-另存为图片,将图片保存到 你运行程序的文件夹 中。如下图:

壹:数据集的准备

任务:我们用不同的方式读取这两张图片(记得右键-另存为图片,保存到程序所在位置,记得文件重命名为你喜欢的方式,我的重命名为002.jpg003.jpg

将文件另存为后,同时新建一个python文件,我的效果如下:

接下来,我们就可以在load_images.py中,进行相关操作了。

贰:用其他库读取图像文件

  • 使用matplotlib库进行图像的读取

matplotlib中的函数跟Matlab很像。

我们需要使用matplotlib.pyplot中的函数:

imread(文件地址):进行读取图像的操作(参数为读取图像文件的路径)

imshow(数组):进行图像的显示操作(显示图像的数组)

show():显示一个窗口,用于显示图像(很多时候,不显示图像的话,是忘记使用这个函数)

我们尝试探讨,图像被读取后的数据类型,大小形状

import matplotlib.pyplot as plt

img = plt.imread(‘002.jpg‘)
#图片的高H为460,宽W为346,颜色通道C为3
print(img.shape)
print(img.dtype)
print(type(img))
plt.imshow(img)
plt.show()

输出为:

(460, 346, 3)
uint8
<class ‘numpy.ndarray‘>

结论:imread读取的图片为numpy.ndarry的数组,数组的大小排列为:高×宽×通道数,数组的数据类型是uint8,即每个数据的大小为[0,255]

如果不想手动进行多图像的读取,需要使用到Python的文件,路径操作等。暂不介绍

手动添加的话,就是用[array1,array2]这种形式,将数组进行连接

import matplotlib.pyplot as plt

img1 = plt.imread(‘002.jpg‘)
img2 = plt.imread(‘003.jpg‘)
img = [img1, img2]
for i in img:
    plt.imshow(i)
    plt.show()

  • 使用cv2进行图像的读取

cv2库中,需要用到的函数有:

imread(文件地址):读取地址处的文件图像

imshow(‘窗口名称‘, 图像数组):将图像数组显示出来,但必须结合waitKey()使用,否则无法显示图像

waitKey(延迟时间):需要设置延迟时间,当延迟时间≤0时,窗口将会一直延迟,延迟无穷长时间,按下任一按键,可以继续执行下面程序。当延迟时间>0,即窗口图像会显示对应毫秒后,自动消失。

import cv2
img1 = cv2.imread(‘002.jpg‘)
print(img1.shape)
print(img1.dtype)
print(type(img1))
cv2.imshow(‘img‘, img1)
cv2.waitKey(0)

输出为:

(460, 346, 3)
uint8
<class ‘numpy.ndarray‘>

结论:imread读取的图片为numpy.ndarry的数组,数组的大小排列为:高×宽×通道数,数组的数据类型是uint8`,即每个数据的大小为[0,255]

Matplotlib与cv2对图像的数据格式的处理是相似的,但是也是有区别的:

对于通道的读取,cv2是按BGR的顺序读入,而matplotlib按RGB的顺序读入


  • 使用PIL库进行图像处理

PIL全称为Python Image Library。是给Python提供图像处理相关的库。

需要使用到的函数:

open(文件地址):打开文件,注意是打开,并没有读取。主要作用是保持检查文件地址,同时保证文件是打开的状态。当对图像处理的时候,会自动加载。

show():使用系统自带的图像查看器,查看图像

from PIL import Image
img1 = Image.open(‘002.jpg‘)
# 因为PIL有自己的数据结构,所以没有shape,dtype属性
# print(img1.shape)
# print(img1.dtype)
print(type(img1))
img1.show()

输出为:

<class ‘PIL.JpegImagePlugin.JpegImageFile‘>

我们可以使用numpy.array()函数,将PIL结构的数据转换成numpy数组。

import matplotlib.pyplot as plt
from PIL import Image
import numpy as np

img1 = Image.open(‘002.jpg‘)
img1 = np.array(img1)
print(img1.shape)
print(img1.dtype)
plt.imshow(img1)
plt.show()

输出:

(460, 346, 3)
uint8

可以看到,PIL转换成numpy后,数据类型是uint8的。


叁:总结

主要介绍了使用matplotlib,cv2,PIL库进行图像文件的读取

  • matplotlib中的imread,imshow,show函数
  • cv2中的imread,imshow,waitKey函数
  • PIL中的open,show函数

原文地址:https://www.cnblogs.com/zhouzhiyao/p/10349369.html

时间: 2024-10-10 02:33:29

Pytorch读取,加载图像数据(一)的相关文章

数字图像处理 CImage类的使用与封装(jpg png gif tif bmp等格式图像的加载、数据读写、保存等功能)

引入CImage类的原因 原有的CBitmap 类只能处理BMP格式的图片,非常受限.而CImage可以处理JPGE.GIF.BMP.PNG等多种格式图片,扩展了图片处理功能且能与CBitmap 进行转换( 因为所载入的位图句柄都是HBITMAP,所以可相互转换),因此引入CImage类进行图像处理. CImage类简介 CImage是MFC和ATL共享的新类,它能从外部磁盘中调入一个JPEG.GIF.BMP和PNG格式的图像文件加以显示,而且这些文件格式可以相互转换. CImage提供增强型的

虚拟列表控件---加载大数据行

虚拟列表控件---加载大数据行 平常所用到的列ListView/ListCtrl控件,都是只有行至几百行数据,直至今日,在项目中遇到了上10W量级数据条,终于感觉到普通加载的艰辛,遂到网上乱找一通,发现大同小异,转载了这篇比较详细的,后面代码所用到的m_Items,为存放的列表的数据结构列表, 这篇文章虽详尽,改日做一个DEMO, Demo 一.什么是虚拟列表控件 虚拟列表控件是指带有LVS_OWNERDATA风格的列表控件.. 二.为什么使用虚拟列表控件 我们知道,通常使用列表控件CListC

Android 多种方式正确的加载图像,有效避免oom

图像加载的方式: Android开发中消耗内存较多一般都是在图像上面,本文就主要介绍怎样正确的展现图像减少对内存的开销,有效的避免oom现象.首先我们知道我的获取图像的来源一般有三种源头:1.从网络加载2.从文件读取3.从资源文件加载 针对这三种情况我们一般使用BitmapFactory的:decodeStream,decodeFile,decodeResource,这三个函数来获取到bitmap然后再调用ImageView的setImageBitmap函数进行展现. 我们的内存去哪里了(为什么

android从网络上异步加载图像

研究了android从网络上异步加载图像: (1)由于android UI更新支持单一线程原则,所以从网络上取数据并更新到界面上,为了不阻塞主线程首先可能会想到以下方法. 在主线程中new 一个Handler对象,加载图像方法如下所示 [java] view plaincopyprint? private void loadImage(final String url, final int id) { handler.post(new Runnable() { public void run()

ios网络学习------4 UIWebView的加载本地数据的三种方式

UIWebView是IOS内置的浏览器,可以浏览网页,打开文档  html/htm  pdf   docx  txt等格式的文件.  safari浏览器就是通过UIWebView做的. 服务器将MIME的标识符等放入传送的数据中告诉浏览器使用那种插件读取相关文件. uiwebview加载各种本地文件(通过loadData方法): - (void)viewDidLoad { [super viewDidLoad]; [self setupUI]; NSString *path = [[NSBund

Android异步加载图像(含线程池,缓存方法)

研究了android从网络上异步加载图像: (1)由于android UI更新支持单一线程原则,所以从网络上取数据并更新到界面上,为了不阻塞主线程首先可能会想到以下方法. 在主线程中new 一个Handler对象,加载图像方法如下所示 [java] view plaincopyprint? private void loadImage(final String url, final int id) { handler.post(new Runnable() { public void run()

ASP.NET仿新浪微博下拉加载更多数据瀑布流效果

闲来无事,琢磨着写点东西.貌似页面下拉加载数据,瀑布流的效果很火,各个网站都能见到各式各样的展示效果,原理大同小异.于是乎,决定自己写一写这个效果,希望能给比我还菜的菜鸟们一点参考价值. 在开始之前,先把实现的基本原理说一下.当夜幕下拉到底部的时候,js可以判断滚动条的位置,到达底部触发js方法,执行jquery的ajax方法,向后台一般处理程序夜幕ashx文件请求数据源,得到json格式的数据源.然后,遍历json数据源,拼接一个li标签,再填充到页面上去. 首先,我们来做个简单的html页面

[翻译][MVC 5 + EF 6] 7:加载相关数据

原文:Reading Related Data with the Entity Framework in an ASP.NET MVC Application 1.延迟(Lazy)加载.预先(Eager)加载.显式(Explicit)加载: EF加载相关数据到实体导航属性有以下几种方式: 延迟加载:当实体第一次读取时,相关数据没有加载.当第一次试图访问导航属性时,所需的导航数据自动加载.这导致多条查询语句被发送到数据库:一条查询实体本身,一条查询实体相关数据.DbContext类默认启用延迟加载

XmlTextReader实例(加载表数据)

以下代码是读取xml的内容,包括列字段信息和表数据.采用线程读取各个表的数据.针对特定的XML格式 private string fileName; private XmlTextWriter writer; /// <summary> /// 数据库类型 /// </summary> private DataBaseType dataBaseType; /// <summary> /// 表名 /// </summary> private DataTabl