matlab图像基础知识

1.MATLAB支持的几种图像文件格式:

⑴JPEG(Joint Photogyaphic Expeyts Group):一种称为联合图像专家组的图像压缩格式。

⑵BMP(Windows Bitmap):有1位、4位、8位、24位非压缩图像,8位RLE(Run length Encoded)的图像。文件内容包括文件头(一个BITMAP FILEHEADER数据结构)、位图信息数据块(位图信息头BITMAP INFOHEADER和一个颜色表)和图像数据。

⑶PCX(Windows Paintbrush):可处理1位、4位、8位、16位、24位等图像数据。文件内容包括文件头、图像数据和扩展色图数据。

⑷TIFF(Tagged Iamge File Format):处理1位、4位、8位、24位非压缩图像,1位、4位、8位、24位packbit压缩图像,1位CCITT压缩图像等。文件内容包括文件头、参数指针表与参数域、参数数据表和图像数据四部分。

⑸PNG(Portable Network Graphics):包括1位、2位、4位、8位和16位灰度图像,8位和16位索引图像,24位和48位真彩色图像。

⑹GIF(Graphics Interchange Format):任何1位到8位的可交换的图像。

⑺HDF(Hierarchial Data Format):有8位、24位光栅图像数据集。

⑻ICO(Windows Icon resource):有1位、4位、8位非压缩图像。

⑼CUR(Windows Cursor resource):有1位、4位、8位非压缩图像。

⑽XWD(X Windows Dump):包括1位、8位Zpixmaps,XYBitmaps,XYPixmmmaps。

⑾RAS(Sun Raster image):有1位bitmap、8位索引、24位真彩色和带有透明度的32位真彩色。

⑿PBM(Portable Bitmap)。

⒀PGM(Portable Graymap)。

⒁PPM(Portable Pixmap)。

2.MATLAB支持五种图像类型,即二值图像、索引图像、灰度图像、RGB图像和多帧图像阵列。有关它们的定义见下表2.1。

表2.1 图像类型及其对应的像素数据类型


图像类型


Double数据


uint8和uint16数据


二值图像


图像为m×n的整数矩阵,元素值范围[0,1]


图像为m×n的整数矩阵,元素值范围[0,1]


索引图像


图像为m×n的整数矩阵,元素值范围[0,p]


图像为m×n的整数矩阵,元素值范围[0,p-1]


灰度图像


图像为m×n的浮点数矩阵,元素值范围[0,1]


图像为m×n的整数矩阵,元素值范围[0,255]或[0,65535]


RGB图像


图像为m×n×3的浮点数矩阵,元素值范围[0,1]


图像为m×n×3的整数矩阵,元素值范围[0,255]或[0,65535]

其中,多帧图像阵列是由多帧图像组成的,每一帧图像可以为前四种图像中的一种,但组成一个多帧图像阵列的图像必须为同一种。cat函数可以将具有相同尺寸的几个独立图像存成多帧文件。对于多帧图像也可以从中提取单帧。

2.2.2 图像类型判断及转换

1.在MATLAB中如果要判断一个图像文件的类型,可使用如下指令:

l         isbw:若图像为二值图像,则返回真。

l         isgray:若图像为灰度图像,则返回真。

l         isind:若图像为索引图像,则返回真。

l         isrgb:若图像为RGB图像,则返回真。

2.在MATLAB系统中,要将一个类型的图像文件转换成另一个类型的图像文件,只需将前一个文件的图像数据用imread读出,再用imwrite以适当的格式写到后一个图像文件中去即可。另外,要将灰度图像I转换成RGB图像,可运用cat指令。cat函数可以把一些单一的图像合并成图像序列。在图像序列中每个图像需有相同的大小,如果是索引图像,色图也要一致。

此外,MATLAB还提供了若干函数,用于图像类型的转换。这些函数有:

l         dither:用抖动法(dithering)转换图像。该函数通过颜色抖动(颜色抖动即改变边沿像素的颜色,使像素周围的颜色近似于原始图像的颜色,从而以空间分辨率来换取颜色分辨率)来增强输出图像的颜色分辨率。该函数可以把RGB图像转换成索引图像或把灰度图像转换成二值图像。

l         gray2ind:灰度图像或二值图像向索引图像转换。

l         grayslice:设定阈值将灰度图像转换为索引图像。

l         im2bw:设定阈值将灰度、索引、RGB图像转换为二值图像。

l         im2double:将图像数组转换为double型。

l         im2uint8:将图像数组转换为uint8型。

l         im2uint16:将图像数组转换为uint16型。该函数不支持二值图像序列的转换。

l         ind2gray:索引图像向灰度图像转换。

l         ind2rgb:索引图像向RGB图像转换。

l         mat2gray:将一个数据矩阵转换为灰度图像。

l         rgb2gray:RGB图像向灰度图像转换或将彩色色图转换成灰度色图。

l         rgb2ind:RGB图像向索引图像转换。包含三种不同方法:均衡量化、最小值量化、色图映射。

l         im2java:一般图像向Java图像转换。

l         label2rgb:标志图像向RGB图像转换。

2.2.3 图像的查询及读写

在MATLAB中要查询一个图像文件的信息,只要用imfinfo指令加上文件及其完整路径名即可。函数调用格式为:

info = imfinfo(filename,fmt)

info = imfinfo(filename)

参数fmt对应于所有图像处理工具箱中所有支持的图像文件格式。

ATLAB提供了两个重要的用于图像文件的读写的指令,分别是从图像文件中读取数据的imread,以及将数据写入到图像文件中的imwrite。

1.imread的常见调用格式为:

A = imread(filename,fmt)

其作用是将文件名用字符串filename表示的,扩展名用fmt表示的图像文件中的数据读到矩阵A中。如果filename所指的为灰度级图像,则A为一个二维矩阵;如果filename所指的为RGB图像,则A为一个m×n×3的三维矩阵。Filename表示的文件名必须在MATLAB的搜索路径范围内,否则需指出其完整路径。

  imread的其他几种重要的调用格式为:

[X,map] = imread(filename.fmt)

[…] = imread(filename)

[…] = imread(URL,…)

[…] = imread(…,idx)           (CUR,ICO and TIFF only)

[…] = imread(…,’frames’,idx)    (GIF only)

[…] = imread(…,ref)           (HDF only)

[…] = imread(…,’BackgroundColor’,BG)    (PNG only)

[A,map,alpha] = imread(…)      (ICO,CUR and PNG only)

上面一些参数的含义如下:idx是指读取图标(cur、ico、tiff)文件中第idx个图像,默认值为1。’frame’,idx是指读取gif文件中的图像帧,idx值可以是数量、向量或’all’。ref是指整数值。alpha是指透明度。

2.imwrite的常用调用格式为:

imwrite(A,filename,fmt)

imwrite(X,map,filename,fmt)

imwrite(…,filename)

imwrite(…,Param1,Val1,Param2,Val2…)

其中imwrite(…,Param1,Val1,Param2,Val2…)可以让用户控制HDF、JPEG、TIFF等一些图像文件格式的输出特性。

  在MATLAB中,默认的保存类型是uint8。由于PNG和TIFF格式支持16位的图像,所以保存这类图像时,保存类型就是uint16。

2.2.4 图像的显示

显示图像的最基本的手段是使用image函数。该函数还产生了图像对象的句柄,并允许对对象的属性进行设置。此外,imagesc函数也具有image的功能,所不同的是imagesc函数还自动将输入数据比例化,以全色图的方式显示。

imshow函数比image和imagesc更常用,它能自动设置句柄图像的各种属性。imshow可用于显示各类图像。对于每类图像,调用方法如下:

l         imshow filename:显示图像文件。

l         imshow(BW):显示二值图像,BW为黑白二值图像矩阵。

l         imshow(X,map):显示索引图像,X为索引图像矩阵,map为色彩图示。

l         imshow(I):显示灰度图像,I为二值图像矩阵。

l         imshow(RGB):显示RGB图像,RGB为RGB图像矩阵。

l         imshow(I,[low high]):将非图像数据显示为图像,这需要考虑数据是否超出了所显示类型的最大允许范围,其中[low high]用于定义待显示数据的范围。

有关图像显示的函数或其辅助函数,除了上述的以外,MATLAB还提供了一些用于进行图像的特殊显示的函数。

l         colorbar:为图像的显示增加一个颜色条,这一用法对于了解被显示图像的灰度级别特别有用。

l         getimage:获取图像数据。

l         immovie:将多帧索引图像制作成连续图像格式。其调用格式为:

mov = immovie(D,map)

不过这种功能只对索引图像有效,其中D为多帧索引图像阵列,map为索引图像的对应色阶。对于其他类型图像,则需要首先将其转换为索引图像。

l         montage:多帧图像的一次显示。它能将每一帧分别显示在一幅图像的不同区域,所有子区的图像都用同一个色彩条。

l         movie:播放多帧连续图像。

l         subimage:在一个图形区域内显示多个图像。

l         truesize:调整图像显示的尺寸。

l         warp:显示图像的纹理表面图。前面提到的图像显示手段都只能在二维平面上显示,MATLAB6.5的一个强大功能是能将平面图像显示在空间三维曲面上。这是由warp函数的纹理成图功能来实现的,该功能能通过双线性插值将平面图像投影到三维曲面上。

l         zoom:将图像或二维图形进行放大或缩小显示。zoom本身是是一个开关键,zoom on用于打开缩放模式,zoom off用于关闭该模式,zoom in用于放大局部图像,zoom out用于缩小图像。

至于多个图像的显示,则可分为两个方面:在不同的图形窗口显示不同的图像,可以用figure指令来实现;在同一个图形窗口显示多图,可以用subplot来实现。

第三章 图像运算

3.1 图像的点运算

点运算将输入图像映射为输出图像,输出图像每个像素点的灰度值仅由对应的输入像素点的值决定。它常用于改变图像的灰度范围及分布,是图像数字化及图像显示的重要工具。点运算因其作用性质,也被称为对比度增强、对比度拉伸或灰度变换。在真正进行图像处理之前,有时可以用点运算来克服图像数字化设备的局限性。

点运算实际上是灰度到灰度的映射过程。点运算不会改变图像内像素点之间的空间关系。设输入图像为A(xy),输出图像为B(x,  y),则点运算可表示为:

B(x,  y) =  f  [A(x,  y)]                 (3-1)

点运算可完全由灰度变换(gray-scale transformation)函数s=f  (r)决定,后者描述了输入灰度级与输出灰度级之间的映射关系。图像的点运算分为线性点运算和非线性点运算两种。

3.1.1 线性点运算

线性点运算是指灰度变换函数 f 为线性函数时的运算。

如图3.1,当 a >1时,输出图像对比度增大;当 a <1时,输出图像对比度降低;当 a =1,b =0时,输出图像就是输入图像的简单复制;当 a =1,b ≠0时,仅使输出图像的灰度值上移或下移,其效果是使整个图像更亮或更暗。如果 a 为负值,暗区域将变亮,亮区域将变暗,点运算完成了图像求补。

除了调节对比度以外,还有一种典型的线性点运算的应用就是灰度标准化。设灰度图像为I[W][H],其中W表示图像宽度,H表示图像的高度,那么灰度图像的平均灰度和方差由如下计算公式得到:

平均灰度:

方差:

可以将其变换为具有相同均值和方差的变换函数(线性映射),其形式如下:

其中σ 0 和u  0 为给定的变换参数。灰度标准化可以用来生成一些常用的平均模型。

3.1.2 非线性点运算

非线性点运算对应于非线性映射函数,典型的映射包括平方函数、对数函数、截取函数(窗口函数)、域值函数、多值量化函数等。

阈值化处理是最常用的一种非线性点运算,它的功能是选择一阈值,将图像二值化,然后使用生成的二进制图像进行图像分割及边缘跟踪等处理。

直方图均衡化也是一种非常常用的非线性点运算。它是指将一个已知灰度分布的图像使用某种非线性灰度变换函数进行计算,使运算结果变成一幅具有均匀灰度分布的新图像。经过直方图均衡化的点运算处理后,实际的直方图将呈现参差不齐的外形,这是由于灰度级的可能个数是限造成的。在一些灰度级处可能没有像素,在另外一些灰度级处则像素很拥挤。

点运算的MATLAB实现:

I=imread(‘rice.png‘);

rice=double(I);

rice2=rice*0.5+50;

J=uint8(rice2);

subplot(1,2,1),imshow(I);

subplot(1,2,2),imshow(J);

时间: 2024-10-05 07:57:00

matlab图像基础知识的相关文章

关于matlab的基础知识

由于基础比较薄弱,所以要从头学起. matlab的常用命令. 数组索引:v=[1 3 5 7 9]则v(2)=3:v(1:3)=1 3 5;v(3:end)=5 7 9;v(1:2:end)=1 5 9;v([1 4 5])=1 7 9;x=linspace(a,b,n)产生一个有n个元素的行向量x,n均分区间[a,b]. 矩阵索引:A=[1 2 3;4 5 6;7 8 9]则A(2,3)=6;A(:,3)=第三列元素:A(2,:)产生第二行元素:A(1:2,1:3)提取矩阵的前两行三列.A(e

matlab pca基础知识

PCA的一些基本资料 最近因为最人脸表情识别,提取的gabor特征太多了,所以需要用PCA进行对提取的特征进行降维. 本来最早的时候我没有打算对提取的gabor特征进行降维,但是如果一个图像时64*64,那么使用五个尺度八个方向的gabor滤波器进行滤波,这样提取的特征足足有64*64*5*8这么多,如果图像稍微大一点,比如128*128的图像,那么直接提取的特征就会几十万,所以不降维的话直接用SVM训练分类器是非常困难的. 所以在这段时间我就学习了一下PCA降维的基本原理和使用方法,网上给出的

MATLAB编程--基础知识

:matlab,数据类型(数值,字符串),选择结构,循环接口,函数,字符串函数和矩阵,文件操作 clc clf clear abort ! diary filename->diary on->diary off which filename editpath a=[0 1+7] b=[a(2) 7 a] 定义了数组a=[0 8]和数组b=[8 7 0 8]. d = [1 2] d(4) = 4 d的值为[1 2 0 4] first:incr:last Angles = (.01:.01:1

OpenCV 基础知识------图像创建、访问、转换

cvCreateImage函数-- Cxcore数组操作 创建头并分配数据 IplImage* cvCreateImage( CvSize size, int depth, int channels ); size 图像宽.高. depth 图像元素的位深度,可以是下面的其中之一: IPL_DEPTH_8U - 无符号8位整型 IPL_DEPTH_8S - 有符号8位整型 IPL_DEPTH_16U - 无符号16位整型 IPL_DEPTH_16S - 有符号16位整型 IPL_DEPTH_32

H265编码等级以及图像的基础知识

目录: 1.H265编码等级 2.图像的基础知识 2.1:像素,分辨率,PPI(像素密度),BPP 扫盲 2.2:RGB.YUV图片像素格式的理解 1. H265编码等级 H264编码profile & level控制 .H265编码初探 H265 profile H265 Profile & Level & Tier 介绍 2. 图像的基础知识 2.1 像素,分辨率,PPI(像素密度),BPP 扫盲: 像素,分辨率,PPI(像素密度),BPP 扫盲 2.2 RGB.YUV图片像素

【Python数据挖掘课程】六.Numpy、Pandas和Matplotlib包基础知识

前面几篇文章采用的案例的方法进行介绍的,这篇文章主要介绍Python常用的扩展包,同时结合数据挖掘相关知识介绍该包具体的用法,主要介绍Numpy.Pandas和Matplotlib三个包.目录:        一.Python常用扩展包        二.Numpy科学计算包        三.Pandas数据分析包        四.Matplotlib绘图包 前文推荐:       [Python数据挖掘课程]一.安装Python及爬虫入门介绍       [Python数据挖掘课程]二.K

【深度分解】听趣拍云产品经理剖析视频基础知识(2)

"随着技术的不断进步,视频技术的制作加工门槛逐渐降低,信息资源的不断增长,同时由于视频信息内容更加丰富完整的先天优势,在近年来已经逐渐成为主流.在基础知识(1)里面已经讲了模拟时代和数字化时代的视频技术.接下来将对视频编码与压缩.画面压缩.运动压缩.互联网视频应用的到来做一个详细的介绍." 视频编码与压缩 视频编码与压缩,是数字化视频非常重要的技术,以至于它直接影响到视频在各个领域的应用.如果没有视频编码技术的不断提高,我们今天也不可能在方方面面享受到视频的便利性. 首先,视频编码是一

Android应用基础知识

Android 应用采用 Java 编程语言编写.Android SDK 工具将您的代码-连同任何数据和资源文件-编译到一APK: Android 软件包,即带有 .apk 后缀的存档文件中.一个 APK 文件包含 Android 应用的所有内容,它是基于 Android 系统的设备用来安装应用的文件. 安装到设备后,每个 Android 应用都运行在自己的安全沙箱内: 1.Android 操作系统是一种多用户 Linux 系统,其中的每个应用都是一位不同的用户: 2.默认情况下,系统会为每个应

前端开发:css基础知识之盒模型以及浮动布局。

前端开发:css基础知识之盒模型以及浮动布局 前言 楼主的蛮多朋友最近都在学习html5,他们都会问到同一个问题 浮动是什么东西?  为什么这个浮动没有效果?  这个问题楼主已经回答了n遍.今天则是把它写到我的博客中,想知道自己过来翻就好啦 ^_^  下面楼主把当前的自己对css的基础认知一一给大家道来...... 盒模型 谈到盒模型,有经验的小伙伴一定滚瓜烂熟,无非就是 内容(content).填充(padding).边框(border).边界(margin): 这些属性我们可以把它转移到我们