任务5 图像的读取及表示 图像的特征 图片特征的降维

任务目的:

  知道图像的表示以及读取方法

  了解图像的特征

  对图像特征进行降维

一、图像的读取及表示

  图像要进行处理才能进行模型输入。

  python自带的库将图像存在矩阵或者张量里面。

  图像由像素组成,一个像素点一般油RGB三维数组构成。

二、图像的特征

  图像的识别should环境因素约束。

  常见的图像颜色特征有:SIFT尺度不变特征变换 和 HOG方向梯度直方图

  颜色特征就是对RGB做一个统计,统计有各颜色的分布百分比。

  前者具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角依然能够很好地识别。

  后者通过计算和统计图像局部区域的梯度方向直方图来构建特征。

  两者的详细说明参照:https://blog.csdn.net/taigw/article/details/42206311

            https://blog.csdn.net/zouxy09/article/details/7929348

三、对图片特征的降维

  一种常用的降维工具——PCA(Principal Component Analysis), 它是一种无监督的学习方法,可以把高维的向量映射到低维的空间里。

  核心思路:对数据做线性的变换,然后在空间里选择信息量最大的Top K维度作为新的特征值。

  具体目标:将原来n为的数据映射到k维上,这k维又叫做主成分。具体映射方法的选择要和原始数据密切相关。

  从数据上来说就是原来的特征矩阵是N*M的,要求左乘或者右乘一个系数矩阵,使得原来矩阵的行数或者列数达到改变,那个系数矩阵怎么构造就是这个算法的关键。

  参考:https://blog.csdn.net/program_developer/article/details/80632779(主成分分析)

   

总结:

  这个任务学得太抽象了,没有学到底层,只学了很多概念。

  之后再完善此博客,任务是了解SIFT和HOG的底层和PCA的底层,也就是看那几篇博客(●‘?‘●)。

 

 

  

      

原文地址:https://www.cnblogs.com/qq2210446939/p/12206565.html

时间: 2024-11-09 09:23:39

任务5 图像的读取及表示 图像的特征 图片特征的降维的相关文章

Python读取TIFF多通道图像

1.PIL from PIL import Image im = Image.open("filename") 支持单通道及多通道Uint8 TIFF图像读取,读取单通道Uint16 TIFF图像转为Uint8处理,直接读取Uint16 TIFF多通道图像出错,错误信息: 2.OpenCV import cv2 cv2.imread("filename",flags) 对于cv2,imread的关于通道数和位深的flags有四种选择: IMREAD_UNCHANGE

转载---CGImageSource对图像数据读取任务的抽象

转载地址:http://www.tanhao.me/pieces/1019.html CGImageSource是对图像数据读取任务的抽象,通过它可以获得图像对象.缩略图.图像的属性(包括Exif信息). 1.创建CGImageSourceRef 1 2 NSString *imagePath = [[NSBundle bundleForClass:self.class] pathForImageResource:@"test.png"]; CGImageSourceRef image

BarCode Reader SDK使用教程:如何从图像中读取条码

我们知道很多语言都可以在windows平台上读取条码,今天将分享在BarCode Reader SDK中如何用VB.NET或者C#来读取图像中的条码. [BarCode Reader SDK下载] 这段代码演示了如何从图像中读取条码及打印到输出控制台. Visual Basic .NET: Imports System.IO Imports Bytescout.BarCodeReader ' requiring to install evaluation or full version of B

OpenCV2学习笔记:图像的读取与显示

1. 图像读取:imread() Mat imread(const string& ?lename, int ?ags=1 ) 参数介绍: filename: 待加载的文件名称. flags: 此标志用来指定被加载图像的颜色类型(color type).这个标志的取值可以有: -- CV_LOAD_IMAGE_ANYDEPTH : 如果设置这个标志的话,如果图像为16位或32位深度的图像,则返回对应深度的图像:否则,将图像转换为8位深度图像再返回. -- CV_LOAD_IMAGE_COLOR

VTK序列图像的读取[转][改]

医学图像处理的应用程序中,经常会碰到读取一个序列图像的操作.比如CT.MR等所成的图像都是一个切面一个切面地存储的,医学图像处理程序要处理这些数据,第一步当然是把这些数据从磁盘等外部存储介质中导入内存. 利用VTK可以读取多种格式的图像文件,支持读取单个的二维图像(比如*.BMP.*.JPEG.*.PNG等)或者三维图像文件(*.VTK.*.mhd.*.mha等),也支持序列图像文件的导入.下面我们详细地讲解如何在VTK里实现序列图像文件的读取(我们以美国可视人的数据做为测试数据,数据可以从这里

Opencv-Python:图像尺寸、图像的读取、显示、保存与复制

Opencv-Python:图像尺寸.图像的读取.显示.保存与复制 原创 2017年11月23日 21:30:49 4440 在使用opencv的方法时,首先必须导入opencv包.新的opencv导入cv2,这里也和cv做了一个对比 [python] view plain copy import cv2 一.图像尺寸 图像的大小可以通过其shape属性来获取,shape返回的是一个tuple元组,第一个元素表示图像的高度,第二个表示图像的宽度,第三个表示像素的通道数. 示例: [python]

图像的读取,显示与保存(基于skimage模块)

一 skiamge模块 skimage包的全称是scikit-image SciKit (toolkit for SciPy) ,它对scipy.ndimage进行了扩展,提供了更多的图片处理功能.它是由python语言编写的,由scipy 社区开发和维护.skimage包由许多的子模块组成,各个子模块提供不同的功能.主要子模块列表如下: 子模块名称 主要实现功能 io 读取.保存和显示图片或视频 data 提供一些测试图片和样本数据 color 颜色空间变换 filters 图像增强.边缘检测

OpenCV中图像的读取,显示与保存

图像的读取,显示与保存 相关函数:cv2.imread().cv2.imshow().cv2.imwrite() 1.读入图像: 用cv2.imread()函数来读取图像,cv2.imread(路径,图像颜色空间)(其中颜色空间默认为BGR彩图)     cv2.IMREAD_COLOR:读入一副彩色图像 cv2.IMREAD_GRAYSCALE:以灰度模式读入图像 cv2.IMREAD_UNCHANGED:读入一幅图像,并且包括图像的 alpha 通道 示例代码 import cv2 img

opencv:图像的读取,显示,写入文件

#include <opencv2/opencv.hpp> #include <iostream> using namespace cv; using namespace std; int main(int argc, char** argv) { // 图像内存对象,在C++中是以Mat对象形式保存的 Mat img = imread("f:/temp/images/lena.jpg"); /* imread的默认选项:IMREAD_COLOR,默认会将图像加