pcA降维算法

http://ufldl.stanford.edu/wiki/index.php/主成分分析

if ~exist(‘train_IM_all‘,‘var‘)||~exist(‘train_LA_all‘,‘var‘)%为加快程序运行，以便重复运行本文件时不需要重复载入数据
    load train_res; %用的还是上次手写数字识别的数据，只是在此之前已经将数据转换为mat文件，所以可以直接用load载入数据
end
X0_te= train_IM_all(:,train_LA_all == 0); %将要处理的数据单独挑出来，注意由于svmtrain函数需要的数据矩阵是每一行存储一个样本值各特征，所以此处要用转置
X1_te = train_IM_all(:,train_LA_all == 1);%同上
X2_te = train_IM_all(:,train_LA_all == 2);%同上
X3_te = train_IM_all(:,train_LA_all == 3);%同上
X4_te = train_IM_all(:,train_LA_all == 4);%同上
X5_te = train_IM_all(:,train_LA_all == 5);%同上
X6_te = train_IM_all(:,train_LA_all == 6);%同上
X7_te = train_IM_all(:,train_LA_all == 7);%同上
X8_te = train_IM_all(:,train_LA_all == 8);%同上
X9_te = train_IM_all(:,train_LA_all == 9);%同上
Xte={X0_te,X1_te,X2_te,X3_te,X4_te,X5_te,X6_te,X7_te,X8_te,X9_te};
w={};%元胞数组以便存储降维矩阵
for i=1:10
avg = mean(Xte{i}, 2); %求每个图像像素强度均值
d=avg*ones(1,size(Xte{i},2));
Xte{i} = Xte{i} -d ;%去均值化
sigma = Xte{i} * Xte{i}‘ / size(Xte{i}, 2);%求出signa值
[U,S,V] = svd(sigma);
%xRot = U‘ * x;          % 旋转的数据
xTilde = U(:,1:256)‘ * Xte{i}; % 降维后的数据
   w=[w,U(:,1:256)‘];   %选取前256个特征向量（这里可以看多少特征更好来选取）
end

然后把原来的样本乘上转化矩阵就好了

有待考究，因为我改了那里的实现代码，昨天直接用那个教程代码，训练到半夜还没出来，正确率很低

结果如下：

所以从现在到期末为止，我不用再做模式识别啦，在23，59分之前把论文写好交了

还有几个游戏要做= =

时间： 2024-10-13 22:50:29

pcA降维算法的相关文章

PCA 降维算法详解以及代码示例

转载地址:http://blog.csdn.net/watkinsong/article/details/38536463 1. 前言 PCA : principal component analysis ( 主成分分析) 最近发现我的一篇关于PCA算法总结以及个人理解的博客的访问量比较高, 刚好目前又重新学习了一下PCA (主成分分析) 降维算法, 所以打算把目前掌握的做个全面的整理总结, 能够对有需要的人有帮助. 自己再看自己写的那个关于PCA的博客, 发现还是比较混乱的, 希望这里能过做好

机器学习公开课笔记(8)：k-means聚类和PCA降维

K-Means算法非监督式学习对一组无标签的数据试图发现其内在的结构,主要用途包括: 市场划分(Market Segmentation) 社交网络分析(Social Network Analysis) 管理计算机集群(Organize Computer Clusters) 天文学数据分析(Astronomical Data Analysis) K-Means算法属于非监督式学习的一种,算法的输入是:训练数据集$\{x^{(1)},x^{(2)},\ldots, x^{(m)}\}$(其中$x^

PCA降维简介

PCA全称为principal componentanalysis,即主成成分分析,用于降维.对数据进行降维有很多原因.比如: 1:使得数据更易显示,更易懂 2:降低很多算法的计算开销 3:去除噪声一:基本数学概念 1:方差均值太简单了,不说了.方差是各个数据分别与其和的平均数之差的平方的和的平均数,用字母D表示.计算公式如下: 其中x-为均值,也可以表示为EX,则方差计算又可写成: 2:协方差及协方差矩阵协方差用于衡量两个变量的总体误差情况,可以说方差是协方差的一种特殊情况,即当两个变量

四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps

四大机器学习降维算法:PCA.LDA.LLE.Laplacian Eigenmaps 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式. y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的).f可能是显式的或隐式的.线性的或非线性的. 目前大部分降维算法处理向量表达的数据,也有一些降维算法处理高阶张量表达的数据.之所以使用降维

【转】四大机器学习降维算法：PCA、LDA、LLE、Laplacian Eigenmaps

最近在找降维的解决方案中,发现了下面的思路,后面可以按照这思路进行尝试下: 链接:http://www.36dsj.com/archives/26723 引言机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达,目前最多使用向量表达形式. y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的).f可能是显式的或隐式的.线性的或非线性的. 目前大部分降维算法

机器学习算法-PCA降维技术

机器学习算法-PCA降维一.引言在实际的数据分析问题中我们遇到的问题通常有较高维数的特征,在进行实际的数据分析的时候,我们并不会将所有的特征都用于算法的训练,而是挑选出我们认为可能对目标有影响的特征.比如在泰坦尼克号乘员生存预测的问题中我们会将姓名作为无用信息进行处理,这是我们可以从直观上比较好理解的.但是有些特征之间可能存在强相关关系,比如研究一个地区的发展状况,我们可能会选择该地区的GDP和人均消费水平这两个特征作为一个衡量指标.显然这两者之间是存在较强的相关关系,他们描述的都是该地区的

sklearn中的降维算法PCA和SVD

sklearn中的降维算法PCA和SVD 1 概述 1.1 从什么叫“维度”说开来 1.2 sklearn中的降维算法 2 PCA与SVD 2.1 降维究竟是怎样实现? 2.2 重要参数n_components 2.2.1 迷你案例:高维数据的可视化 2.2.2 最大似然估计自选超参数 2.2.3 按信息量占比选超参数 2.3 PCA中的SVD 2.3.1 PCA中的SVD哪里来? 2.3.2 重要参数svd_solver 与 random_state 2.3.3 重要属性components_

sklearn pca降维

PCA降维一.原理这篇文章总结的不错PCA的数学原理. PCA主成分分析是将原始数据以线性形式映射到维度互不相关的子空间.主要就是寻找方差最大的不相关维度.数据的最大方差给出了数据的最重要信息. 二.优缺点优:将高维数据映射到低维,降低数据的复杂性,识别最重要的多个特征不足:不一定需要,且可能损失有用信息适用数值型数据三.步骤 1.原始数据X,对于每列属性,去平均值(也可以对数值进行标准分化) 2.计算样本点的协方差矩阵(列间两两计算相关性) 3.求出协方差矩阵的特征值和对应的特征向

ML: 降维算法-概述

机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习一个映射函数 f : x->y,其中x是原始数据点的表达, y是数据点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的).f可能是显式的或隐式的.线性的或非线性的.使用降维的原因: 压缩数据以减少存储量. 去除噪声的影响从数据中提取特征以便于进行分类将数据投影到低维可视空间,以便于看清数据的分布变量(特征)数量相对数据条数有可能过大,从而不符合某些模型的需求.打

猜你喜欢

如何使用单机单网卡实现公司内、外网访问

在我所将要实施的一个项目中,某公司内部有两套网络系统实现内.外网的物理隔离,员工访问内.外网时使用的双网卡隔离器来切换实现上不同的网络.而随着业务和科技的进步,用户需要布署一套桌面云系统,用桌面云来打 ...

HDOJ-ACM1071(JAVA) 定积分

这道题做起来有点无奈,定积分已经忘得差不多了~还可恶的去搜索了抛物线的解析式的求法~哈哈不过求出来的结果不对...等有时间再去研究这个数学问题吧 - - 以下是JAVA实现: import java ...

mysql 存储引擎介绍

一.InnodDB InnoDB表是基于聚蔟索引建立的,默认级别是 REPEATABLE_READ(可重复读),支持热备份,mysql 的其它引擎不支持. 支持行级锁,用来处理大量的短期事务.Inn ...

Linux多线程实践(3) --线程属性

初始化/销毁线程属性 int pthread_attr_init(pthread_attr_t *attr); int pthread_attr_destroy(pthread_attr_t *att ...

文章内容目录更新

寻找100个中国自主自有品牌跨境产品创业者 6个有关<微品牌故事会>常见问答回复"menu"即可获得本公众号内容清单回复数字1~50,可获得<微品牌故事会&g ...

HDU 1969 Pie (二分查找)

题目链接:click here~~ 题目大意:n块馅饼分给m+1个人,每一个人的馅饼必须是整块的.馅饼能够被切开.但不能组合,也不一定要所有分完,问你每一个人最大能分到多大体积的馅饼面积. [解题思路 ...

英文邮件写作

Let’s postpone the presentation to Monday as some of you ran into time conflicts. BTW(by the way ) I ...

【大话设计模式】——浅谈设计模式基础

初学设计模式给我最大的感受是:人类真是伟大啊!单单是设计模式的基础课程就让我感受到了强烈的生活气息. 个人感觉<大话设计模式>这本书写的真好.让貌似非常晦涩难懂的设计模式变的生活化.趣味化 ...

struts 中的addFieldError

addFieldError("字段名","错误信息")给一个字段(属性)添加错误消息在action中添加 this.addFieldError("p ...

html清除浮动的6种方法示例

使用display:inline-block会出现的情况: 1.使块元素在一行显示2.使内嵌支持宽高3.换行被解析了4.不设置的时候宽度由内容撑开5.在IE6,7下步支持块标签由于inline-bl ...

数据挖掘一

回忆: 周六有时间今天下午有时间去看大二上时候写的数据挖掘相关的遗传算法,准备整理一下.ps:帮老师实现验证部分猜想,论文源自老师. 项目介绍: 算法简化描述大体主要大体主要是这些,做的是对作弊网络 ...

htmlcleaner使用及xpath语法

一.HtmlCleaner 1.创建htmlCleaner对象 HtmlCleaner htmlCleaner = new HtmlCleaner(); 2.调用clean方法 TagNode tag ...

bzoj 2466 异或方程组

对于每个灯,我们用一个变量表示其决策,xu=0表示不选,xu=1表示选.因为每个灯最后必须都亮,所以每个等都对应一个异或方程. 解这个异或方程组,有几种情况: 1.存在唯一解(得到的上三角系数矩阵的主 ...

使用旗正规则引擎内存表出错的原因及解决方法

1 内存表 1.1 汇总 1.1.1 错误汇总列中必须包含分组列所属部门 1.1.2 解决方案点击图片中的“sum(基本工资)”,弹出窗体,将所属部门 ...

html_helper 分页

1 # -*- coding: utf-8 -*- 2 3 from django.utils.safestring import mark_safe 4 ''' 5 Created on 2017年 ...

yum安装出现No package vim available解决办法

今天我在用CentOS 7的yum命令安装的时候出现如下错误: [[email protected] ~]# yum install vimLoaded plugins: fastestmirrorL ...

从身份证获取年龄

8:输入一个身份证号码(15位和18位)和一个年份,计算现在的年龄(忽略非法参数) eg:610618199001020065 2011 输出:21 package prctice01; /*8. ...

DeepID2+人脸识别算法学习

DeepID2+在DeepID2的基础上,继续对网络结构做了修改,同时增加了对卷积圣经网络的分析,发现了几个特征:(1)适度稀疏,及时将神经元二值化之后,认证效果依然很好:(2)选择性,高层神经元对认 ...

Linux系统用logrotate切割Tomcat日志的方法

tomcat在使用中会遇到catalina.out日志过大的情况,下面我们利用系统(以centos为例)自带的logrotate来切割文件,实现日志文件的每天自动切割. logrotate程序默认程序 ...

关于grid++report总结篇

QQ:1187362408 欢迎技术交流和学习关于grid++report总结篇(grid++report): TODO: 1,报表头:标题信息 2,页眉:页码信息 3,标题行:标题信息 4,内容行 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.