流形学习笔记

  • 维数约简
  1. 特征选择,依据某一标准选择性质最突出的特征
  2. 特征抽取,经已有特征的某种变换获取约简特征

增加特征数:

  1. 可以增加信息量,进而提高准确度
  2. 增加训练分类器的难度,进而带来维数灾难。

解决办法:

  选取尽可能多的、可能有用的特征,然后根据需要进行特征约简。

  • 主成分分析(PCA)

目的:

  寻找能够表示采样数据的最好投影子空间。

求解:

  对样本的散布矩阵(scatter matrix)进行特征值分解,所求之空间为过样本均值,(何为过样本均值?)

以最大特征值所对应的特征向量为方向的之空间。

特点:

  1. 对椭球状分布的样本集具有很好的效果,理论上,学习到的主方向就是椭圆的主轴方向。
  2. 非监督学习算法,能找到很好地代表所有样本的方向,但是,对于分类未必是最有利的,如下图:  

线性判别分析(LDA)

思想:

  寻找最能把两类样本分开的投影直线

特点:

  监督的维数约简

目标:

  是投影后两类样本的均值之差与投影样本的总类散步的比值最大。

求解:

  把原问题转化为关于样本集总类内散步矩阵和总类间散步矩阵的广义特征值问题。

  • 多重判别分析(MDA)

  LDA往多类情况的推广

  解法与LDA类似,对于C-类问题,把样本投影到C-1维之空间。

线性方法的缺点:

线性方法对于某些数据不能进行有效的处理,这类数据,在现实中,往往很多。比如下图:

另外,现实中的数据往往并不是特征的线性组合。

比如 paper:A Global Geometric Framework for Nonlinear Dimensionality Reduction 所提到的人脸模型

  • 流形学习
  1. 是线性之空间的一种非线性推广;
  2. 一种局部可坐标话的拓扑空间结构;
  3. 一种非线性额维数约简方法。

可行性分析:

  1. 许多高维采样数据都是由少数几个隐含变量所决定的, 如人脸采样由光线亮度, 人离相机的距离, 人的头部姿势, 人的脸部肌肉等因素决定;
  2. 从认知心理学的角度来看, 心理学家认为人的认知过程是基于认知流形和拓扑连续性的。

几种经典的流形学习方法:

  局部线性嵌入(LLE) Nonlinear dimensionality reduction by locally linear embedding. Science

  等距映射(IsoMap)A global geometric framework for nonlinear dimensionality reduction. Science,

  拉普拉斯特征映射(Laplacian Eigenmap)Laplacian Eigenmaps for Dimensionality Reduction and Data Representation. Neural Computation,

参考:

  1. 自动化所 流形学习 课件。
  2. paper:A Global Geometric Framework for Nonlinear Dimensionality Reduction, science,2000
时间: 2024-08-15 07:28:44

流形学习笔记的相关文章

深度学习笔记(五):LSTM

深度学习笔记(一):logistic分类 深度学习笔记(二):简单神经网络,后向传播算法及实现 深度学习笔记(三):激活函数和损失函数 深度学习笔记(四):循环神经网络的概念,结构和代码注释 深度学习笔记(五):LSTM 看到一篇讲LSTM非常清晰的文章,原文来自Understanding LSTM Networks , 译文来自理解LSTM网络 Recurrent Neural Networks 人类并不是每时每刻都从一片空白的大脑开始他们的思考.在你阅读这篇文章时候,你都是基于自己已经拥有的

vector 学习笔记

vector 使用练习: /**************************************** * File Name: vector.cpp * Author: sky0917 * Created Time: 2014年04月27日 11:07:33 ****************************************/ #include <iostream> #include <vector> using namespace std; int main

Caliburn.Micro学习笔记(一)----引导类和命名匹配规则

Caliburn.Micro学习笔记(一)----引导类和命名匹配规则 用了几天时间看了一下开源框架Caliburn.Micro 这是他源码的地址http://caliburnmicro.codeplex.com/ 文档也写的很详细,自己在看它的文档和代码时写了一些demo和笔记,还有它实现的原理记录一下 学习Caliburn.Micro要有MEF和MVVM的基础 先说一下他的命名规则和引导类 以后我会把Caliburn.Micro的 Actions IResult,IHandle ICondu

jQuery学习笔记(一):入门

jQuery学习笔记(一):入门 一.JQuery是什么 JQuery是什么?始终是萦绕在我心中的一个问题: 借鉴网上同学们的总结,可以从以下几个方面观察. 不使用JQuery时获取DOM文本的操作如下: 1 document.getElementById('info').value = 'Hello World!'; 使用JQuery时获取DOM文本操作如下: 1 $('#info').val('Hello World!'); 嗯,可以看出,使用JQuery的优势之一是可以使代码更加简练,使开

[原创]java WEB学习笔记93:Hibernate学习之路---Hibernate 缓存介绍,缓存级别,使用二级缓存的情况,二级缓存的架构集合缓存,二级缓存的并发策略,实现步骤,集合缓存,查询缓存,时间戳缓存

本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱好者,互联网技术发烧友 微博:伊直都在0221 QQ:951226918 -----------------------------------------------------------------------------------------------------------------

Activiti 学习笔记记录(三)

上一篇:Activiti 学习笔记记录(二) 导读:上一篇学习了bpmn 画图的常用图形标记.那如何用它们组成一个可用文件呢? 我们知道 bpmn 其实是一个xml 文件

HTML&CSS基础学习笔记8-预格式文本

<pre>标签的主要作用是预格式化文本.被包围在 pre 标签中的文本通常会保留空格和换行符.而文本也会呈现为等宽字体. <pre>标签的一个常见应用就是用来表示计算机的源代码.当然你也可以在你需要在网页中预显示格式时使用它. 会使你的文本换行的标签(例如<h>.<p>)绝不能包含在 <pre> 所定义的块里.尽管有些浏览器会把段落结束标签解释为简单地换行,但是这种行为在所有浏览器上并不都是一样的. 更多学习内容,就在码芽网http://www.

java/android 设计模式学习笔记(14)---外观模式

这篇博客来介绍外观模式(Facade Pattern),外观模式也称为门面模式,它在开发过程中运用频率非常高,尤其是第三方 SDK 基本很大概率都会使用外观模式.通过一个外观类使得整个子系统只有一个统一的高层的接口,这样能够降低用户的使用成本,也对用户屏蔽了很多实现细节.当然,在我们的开发过程中,外观模式也是我们封装 API 的常用手段,例如网络模块.ImageLoader 模块等.其实我们在开发过程中可能已经使用过很多次外观模式,只是没有从理论层面去了解它. 转载请注明出处:http://bl

[原创]java WEB学习笔记48:其他的Servlet 监听器:域对象中属性的变更的事件监听器 (3 个),感知 Session 绑定的事件监听器(2个)

本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱好者,互联网技术发烧友 微博:伊直都在0221 QQ:951226918 ---------------------------------