数字图像基础

开始学习数字图像处理和MATLAB的一部分使用。以下是数字图像的一些基本知识概念,用以加深对数字图像处理的理解。

1.图像的表示方法

(1)二进制图像(二值图像):

该操作只返回与二进制图像的形式或结构有关的信息。 常用位图格式储存。 转换成二值图像:im2bw()

(2)灰度图像(单色图像):

8位表示一个像素,0表示黑色,255表示白色。 无符号整型表示的灰度图像每个像素在[0, 255]或[0, 65535]范围内取值;双精度类型表示的灰度图像,每个像素在[0.0, 1.0]范围内取值。

(3)GRB图像(真彩色):

是一种彩色图像的表示方法,存储为一个M*N*3的多维数据矩阵。 每个像素中的每种颜色分量占8位,每一位由[0, 255]中的任意数值表示,那么一个像素由24位表示,允许的最大值为2^24(通常记为16M)。RGB图像不使用调色板。

(4)索引图像:

索引图像包含一个数据矩阵X和一个颜色映射(调色板)矩阵map。 颜色映射矩阵map是一个m*3的数据阵列,其中每个元素的值均为[0, 1]之间的双精度浮点型数据。 调色板通常与索引图像存储在一起,装载图像时,调色板将和图像一同自动装载。

(5)多帧图像(多页图像/图像序列):

主要用于需要对时间或场景上相关图像集合进行操作的场合。 在MATLAB中,用一个四维数组表示多帧图像,其中第四维用来指定帧的序号。图像处理工具箱支持在同一个数组中存储多幅图像,每一幅图像称为一帧。如果一个数组中包含多帧,那么这些图像的第四维是相互关联的。在一个多帧图像数组中,每一帧图像的大小和颜色分量必须相同,并且这些图像使用的调色板也必须相同。

2.图像的数据结构

(1)矩阵

(2)链码:

分为4向链码和8向链码。边界链码的表示与起始点的选取直接相关,起始点不同,链码的表示也不相同。为了实现链码与起始点无关,需要将链码归一化。简单的归一化方法将链码看成一个自然数,取不同的起始点,得到不同的链码。比较这些自然数表示的链码找到其中最小的自然数。

(3)拓扑结构:

分为4-邻域(只考虑上下左右),对角邻域(只考虑对角上的4个像素点),4-邻域和对角邻域都加上称为8-邻域。 若连接像素的都是 4-领域像素点,则像素称为4-连通,这个集合称为4-组元。同理可知8-连通和8-组元。

(4)关系结构

常用的描述方法为串描述和树描述。 串描述适用于那些图像元素的连接可以用来从头到尾或用其它连续形式的图像元素的描述。 链码就是基于串描述思想描述的。 而树描述则是一种能够对不连接区域进行很好描述的方法。

3.图像文件格式

(1)BMP

分为设备相关位图(DDB)和设备无关位图(DIB),Windows 3.0 作为分界。 默认文件扩展名是 .BMP或 .bmp。  扫描方式:从左到右、从上到下的顺序

(2)GIF

分为静态GIF和动画GIF。 扩展名为 .GIF 或 .gif。GIF文件的数据是一种基于LZW算法的连续色调的无损压缩格式,但只能显示256色。

(3)JPEG

分为标准JPEG、渐进式JPEG及JPEG 2000。 扩展名为 .jpg 或 .jpeg。 JPEG使用一种有损压缩算法,但是这种损失很小以至于很难察觉。当编辑和重新保存JPEG文件时,会使原始图像数据的质量下降。因此,JPEG格式不适用于所含颜色很少、具有大块颜色相近的区域或亮度差异十分明显的较简单的图片。

(4)TIFF

有四种类型:TIFF-B适用于二值图像; TIFF-G 适用于黑白灰度图像; TIFF-P 适用于带调色板的彩色图像; TIFF-R 适用于RGB真彩图像。  扩展名为 .tif 或 .tiff。TIFF文件格式善于应用指针的功能,可存储多份调色板数据,可以存储多幅图像。

时间: 2024-11-07 13:27:54

数字图像基础的相关文章

数字图像处理(一) 数字图像基础

一.视觉感知 人眼视觉结构 光线从光路系统投射到视网膜上(角膜->前房->晶状体->视网膜) 视网膜上的中央凹一般作为视觉的中心点,中央凹附近为黄斑,在盲点附近没有视网膜细胞,但存在神经(将视觉信息传输到大脑) 视网膜由视锥细胞和视杆细胞组成 视锥细胞(约650万):明视觉细胞,感知成像的形状,人的视网膜中有三种不同的视锥细胞,对光谱的敏感值分别在: 430nm(蓝光) 540nm(绿光) 570nm(红光) 人的颜色视觉主要由这三种颜色的光构成(三原色) 视杆细胞(约一亿):暗视觉细胞

流媒体 3——彩色数字图像基础

1. 视觉系统的颜色感知 颜色是视觉系统对可见光的感知结果.可见光是波长在380 nm-780 nm之间的电磁波,我们看到的大多数光不是一种波长的光,而是由许多不同波长的光组合成的.(1).眼睛本质上是一个照相机.人的视网膜(human retina)通过神经元来感知外部世界的颜色,每个神经元或者是一个对颜色敏感的锥体(cone),或者是一个对颜色不敏感的杆状体(rod).(2).红.绿和蓝三种锥体细胞对不同频率的光的感知程度不同,对不同亮度的感知程度也不同,人们可以使用数字图像处理技术来降低数

数字图像基础之图像取样和量化(Image Sampling and Quantization)

1.    取样和量化的基本概念(Concepts) 获取图像的目标是从感知的数据中产生数字图像,但是传感器的输出是连续的电压波形,因此需要把连续的感知数据转换为数字形式.这一过程由图像的取样与量化来完成.  数字化坐标值称为取样:数字化幅度值称为量化. 图像采样 ◆  在取样时,若横向的像素数(列数)为M ,纵向的像素数(行数)为N,则图像总像素数为M*N个像素. ◆   一般来说,采样间隔越大,所得图像像素数越少,空间分辨率低,质量差,严重时出现马赛克效应:采样间隔越小,所得图像像素数越多,

数字图像基础之图像内插

内插是图像放大.收缩.旋转等任务中广泛采用的基本工具(图像重采样).如由已知像素灰度估计未知位置的像素灰度. 最近邻内插法 直接取原图像中与其距离最近的像素的灰度值为该点的灰度值. 设i+u, j+v(i, j为正整数, u, v为大于零小于1的小数,下同)为待求象素坐标,则待求象素灰度的值 f(i+u, j+v) 如下图所示: 如果(i+u, j+v)落在A区,即u<0.5, v<0.5,则将左上角象素的灰度值赋给待求象素,同理,落在D区则赋予右下角象素的灰度值.最邻近元法计算量较小,但可能

数字图像基础(Digital Image Fundamentals)之图像的感知和获取(Image Sensing and Acquisition)

人类感知只限于电磁波谱的视觉波段,成像机器则可以覆盖几乎全部电磁波谱.各类图像都是由"照射"源和形成图像的"场景"元素对光能的反射或吸收相结合而产生的. 一副平面图像可以用二维亮度函数来表示,当一副图像从物理过程产生时,它的值正比于物理源的辐射能量,因此,f(x,y)一定是非零和有限的,即:   ; 当用数学方法描述图像信息时,通常着重考虑它的点的性质.例如一副图像可以被看作是空间各个坐标点的结合.它的最普通的数学表达式为:其中(x,y,z)是空间坐标,λ是波长,t

数字图像处理--数字图像基础

图像获取和量化 通过对人眼视觉的研究可以知道人眼是如何获取图像.在人眼的玻璃体中晶状体的后部分布了600-700万的锥状体和7500-15000万杆状体,锥状体主要是来感应彩色也就是亮视觉,每个锥状体都和神经末梢相连接因此这部分感应彩色的视网膜能感应彩色且能感应细节,杆状体是暗视觉末梢,多个(2-4)杆状体和一个神经末梢相连,且这一部分只能感应灰度也就是月光下的物体的颜色细节不如锥状体细胞:因此人们发明了图像采集的原件,最早的是黑白的就是0和1,到后来就是灰度的,就是连续有变化梯度的所以就有关于

机器学习实践指南:案例应用解析

试读及购买链接 <机器学习实践指南:案例应用解析>是机器学习及数据分析领域不可多得的一本著作,也是为数不多的既有大量实践应用案例又包括算法理论剖析的著作,作者针对机器学习算法既抽象复杂又涉及多门数学学科的特点,力求理论联系实际,始终以算法应用为主线,由浅入深以全新的角度诠释机器学习. 前 言第一部分 准备篇第1章 机器学习发展及应用前景 21.1 机器学习概述 21.1.1 什么是机器学习 31.1.2 机器学习的发展 31.1.3 机器学习的未来 41.2 机器学习应用前景 51.2.1 数

Atitit 图像处理的摩西五经attilax总结

1. 数字图像处理(第三版)1 2. 图像处理基础(第2版)(世界著名计算机教材精选)1 3. 计算机视觉特征提取与图像处理(第三版)2 4. OpenCV图像处理 2 4.1. 模式识别(英文版)(第4版) 西奥多里德斯著2 4.2. 图像处理,分析与机器视觉 第三版Sonka等著 艾海舟等译2 4.3. 计算机视觉:理论与算法 RichardSzeliski著2 1. 数字图像处理(第三版) 作者:(美)冈萨雷斯,(美)伍兹 著 Line 1: 第1章 绪论 Line 10: 第2章 数字图

6本值得收藏的数字图像处理书籍!

在这个看脸的时代,颜值就是一切.怎样可以成为控制颜值的"黑魔法师"?相信,阅读以下这些经典的图像处理书籍能够助你一臂之力.赶紧紧随大圣众包威客平台的脚步吧! <数字图像处理基础> 随着台式计算机的处理能力日益增强,各种图像拍摄的设备(例如平板电脑.手机摄像头.数码相机.扫描仪等)的普及,以及互联网的加持,使得数字图像处理变得与文字处理一样普及.本书就数字图像处理的各个基本主题,先给出有关问题的数学公式,然后根据数学公式给出实现有关问题的伪代码,最后在Java语言及Image