深度学习笔记——PCA原理与数学推倒详解

　　PCA目的：这里举个例子，如果假设我有m个点，{x(1),...,x(m)}，那么我要将它们存在我的内存中，或者要对着m个点进行一次机器学习，但是这m个点的维度太大了，如果要进行机器学习的话参数太多，或者说我要存在内存中会占用我的较大内存，那么我就需要对这些个点想一个办法来降低它们的维度，或者说，如果把这些点的每一个维度看成是一个特征的话，我就要减少一些特征来减少我的内存或者是减少我的训练参数。但是要减少特征或者说是减少维度，那么肯定要损失一些信息量。这就要求我在减少特征或者维度的过程当中呢，尽可能少的损失信息量，这就是PCA算法的目的。

　　也就是说，对于我的每一个点我要找到一个新的表达形式，也相当于找到一个函数，让f(x)=c。

　　对于恢复来说，我们这里选择最简单的矩阵相乘的形式让我们的新的表达c变回n维。即，这里。

　　这里我们加一个约束，那就是D的列向量互相时间是正交的（注意：如果不是l=n的情况，D是不能说成是正交矩阵的）。

　　接下来我们就要将我们的想法转变为可以实施的算法了。

　　我们都知道在机器学习中，有一种函数叫做代价函数，英文是cost function，这个函数的作用就是用来评估你模型的输入和输出之间的差距的。如果你的模型输出和输入的差距越大，这个cost function的值就越大。

　　我们借用这样一个思想，如果我要找到一个可以尽可能损失信息的c的表达，那我就让g(c)尽可能的和x相同，也就是构造了一个代价函数，我们的目的就是让这个代价函数的值变成最小。数学表达式如下：

　　　　　　

　　我们这里将这个欧几里得距离加上一个平方，我的理解是方便计算，反正增减性啊都是一样的。

　　那我们的表达式就变成了这样：

　　　　　　　

　　等式右边这一项等于：

　　　　　　

　　这里是因为x和g(c)都是n维向量，的结果是一个标量，就是一个数，转置自然等于自身啦。

　　那么现在我们的问题变成了这样：

　　然后我们把g(c)带入公式中：

　　　　　　　　　　　　

　　　　　　　　　　　　　　

　　还记得D的约束吗？D的列向量相互之间是正交的，所以D^TD=I。

　　那么到现在为止，我就可以得到我这个式子的结果了，对上面这个表达式对C求导：

　　　　

　　现在我们发现，要想对x进行PCA处理，我们只需要找到这个矩阵D，然后让它的转置乘以X就好了。

　　即PCA和解码的过程就是：

　　那么现在我们来算这个矩阵D。

　　

　　还是根据代价函数的思想，我们得到了上述公式。

　　为了得到这个算法，我们首先考虑最简单的l=1的情况。也就是说，D中只包含了一个向量d。

　　这样我们得到：

　　我们将这个公式美化一下：

　　然后我们将所有的x点都带入进去，统一用X表达，X就是一个m*n的矩阵。

　　

　　经过一个等价变化我们得到了有关于矩阵的迹的表达式：

　　　　　　　　

　　

　　这中间我们去掉了与d无关的项。

　　　　　　

　　　　　　

　　然后我们进行一下化简：

　　　　　　　

　　　　　　　　

　　那现在这个问题就可以根据特征值来求解了。得到的d就是X^TX的最大的特征值对应的特征向量。

　　那么对于l>1的情况，DD就是最大l个特征值对应的特征向量的组合。

　　参考自：Deep Learning 。作者：Yoshua Bengio, Ian Goodfellow, Aaron Courville

　　

　　

　　

　　

时间： 2024-07-30 10:12:05

深度学习笔记——PCA原理与数学推倒详解的相关文章

算法学习笔记 KMP算法之 next 数组详解

最近回顾了下字符串匹配 KMP 算法,相对于朴素匹配算法,KMP算法核心改进就在于:待匹配串指针 i 不发生回溯,模式串指针 j 跳转到 next[j],即变为了 j = next[j]. 由此时间复杂度由朴素匹配的 O(m*n) 降到了 O(m+n), 其中模式串长度 m, 待匹配文本串长 n. 其中,比较难理解的地方就是 next 数组的求法.next 数组的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀,也可看作有限状态自动机的状态,而且从自动机的角度反而更容易推导一些. "前

Cocos2d-x学习笔记（十四）CCAutoreleasePool详解

原创文章,转载请注明出处:http://blog.csdn.net/sfh366958228/article/details/38964637 前言之前学了那么多的内容,几乎所有的控件都要涉及内存管理类CCAutoreleasePool,所以这一次的学习笔记,我们一起来看看CCAutoreleasePool,先从CCObject的autorelease方法入手. CCObject::autorelease CCObject* CCObject::autorelease(void) { // 将

Kinect学习笔记之三Kinect开发环境配置详解

0.前言: 首先说一下我的开发环境,Visual Studio是2013的,系统是win8的64位版本,SDK是Kinect for windows SDK 1.8版本.虽然前一篇博文费了半天劲,翻译了2.0SDK的新特性,但我还是决定要回退一个版本. 其实我之前一直在用2.0的SDK在调试Kinect,但无奈实验室提供的Kinect是for Windows 1.0版本的,而且Kinect从1.8之后就好像是一个分水岭,就比如win8和win7有很大的差别,2.0版的Kinect和SDK都是相较

sql学习笔记（16）----------mysql存储过程详解

mysql存储过程详解 1. 存储过程简介我们常用的操作数据库语言SQL语句在执行的时候需要要先编译,然后执行,而存储过程(Stored Procedure)是一组为了完成特定功能的SQL语句集,经编译后存储在数据库中,用户通过指定存储过程的名字并给定参数(如果该存储过程带有参数)来调用执行它. 一个存储过程是一个可编程的函数,它在数据库中创建并保存.它可以有SQL语句和一些特殊的控制结构组成.当希望在不同的应用程序或平台上执行相同的函数,或者封装特定功能时,存储过程是非常有用的.

JQuery学习笔记系列（一）----选择器详解

笔者好长时间没有更新过博客园的笔记了,一部分原因是去年刚刚开始工作一段时间忙碌的加班,体会了一种每天加班到凌晨的充实感,之后闲暇时间了也因为自己懒惰没有坚持记笔记的习惯,现在重新拾起来. 借用古人的一段话与诸君共勉: 人之为学,不日进则日退,独学无友,则孤陋而难成:久处一方,则习染而不自觉.不幸而在穷僻之域,无车马之资,犹当博学审问, 古人与稽,以求其是非之所在.庶几可得十之五六.若既不出户,又不读书,则是面墙之士,虽子羔.原宪之贤,终无济于天下. 翻译为:人们求学(或做学问),不能天天上进,就

iOS5 ARC学习笔记：strong、weak等详解

iOS5中加入了新知识,就是ARC,其实我并不是很喜欢它,因为习惯了自己管理内存.但是学习还是很有必要的. 在iOS开发过程中,属性的定义往往与retain, assign, copy有关,我想大家都很熟悉了,在此我也不介绍,网上有很多相关文章. 现在我们看看iOS5中新的关键字strong, weak, unsafe_unretained. 可以与以前的关键字对应学习strong与retain类似,weak与unsafe_unretained功能差不多(有点区别,等下会介绍,这两个新关键字与

Objective-C学习笔记：defer的实现方法详解

这篇文章会对 libextobjc 中的一小部分代码进行分析,也是如何扩展 Objective-C 语言系列文章的第一篇,笔者会从 libextobjc 中选择一些黑魔法进行介绍. 对 Swift 稍有了解的人都知道,defer 在 Swift 语言中是一个关键字:在 defer 代码块中的代码,会在作用域结束时执行.在这里,我们会使用一些神奇的方法在 Objective-C 中实现 defer. 如果你已经非常了解 defer 的作用,你可以跳过第一部分的内容,直接看 Variable Att

05.学习笔记-linux用户信息管理之文件详解

/etc/passwd用户账户信息. /etc/shadow安全用户账户信息. /etc/group组账户信息. /etc/gshadow安全组账户信息. /etc/default/useradd账户创建的默认值. /etc/skel/包含默认文件的目录. /etc/login.defsShadow密码套件配置. /etc/passwd account:用户名 password:密码 UID:用户身份证明 /etc/passwd GID:基本组ID,群体身份 /etc/group comment

【转】Android开发学习笔记：5大布局方式详解

Android中常用的5大布局方式有以下几种: 线性布局(LinearLayout):按照垂直或者水平方向布局的组件. 帧布局(FrameLayout):组件从屏幕左上方布局组件. 表格布局(TableLayout):按照行列方式布局组件. 相对布局(RelativeLayout):相对其它组件的布局方式. 绝对布局(AbsoluteLayout):按照绝对坐标来布局组件. 1. 线性布局线性布局是Android开发中最常见的一种布局方式,它是按照垂直或者水平方向来布局,通过“android:

猜你喜欢

2016年是我的新起点？

能走到今天这步田地,也只能怪自己不努力. 总没事提醒自己,温水效应,温水效应,最后还是发生在我的身上. Java 程序猿. 2013年参加培训. 同年12月16日入职我程序路上的第一家公司.工作至今, ...

POJ1037：A decorative fence(DP)

Description Richard just finished building his new house. Now the only thing the house misses is a c ...

简易的git工作流程示意图

本作品采用知识共享署名 4.0 国际许可协议进行许可.

drbd总结

DRBD(Distributed Replicated BlockDevice),DRBD 号称是 "网络 RAID",开源软件,由 LINBIT 公司开发.DRBD实际上是一种块 ...

PHP中include和require的区别详解

1.概要 require()语句的性能与include()相类似,都是包括并运行指定文件.不同之处在于:对include()语句来说,在执行文件时每次都要进行读取和评估:而对于require()来说 ...

spring boot 登录注册 demo

Welcome to Spring Boot 代码结构 src/main/java 下 controller层,路由功能dao层,数据库的访问domain,bean的存放service,业务层appl ...

js-DOM ～ 04. BOM：浏览器对象模型window. 、定时器、在线用户、祝愿墙、BOM的内置方法内置对象

multiple. select列表多选触发事件后调用有参数的函数要先创建一个函数,然后在函数内调用执行函数 Array.from(伪数组):伪数组变为真数组 indexOf():查询字符的索引 a ...

EasyUI 页面分页

DAO package com.hanqi.dao; import java.util.ArrayList; import java.util.List; import org.hibernate.S ...

007 项目库存管理系统开始

库存管理系我们的程序需要实现绿色部分 ● 入库 ● 出库 ○ 领用 ○ 调拨 -> 多点通信 ● 商品信息 ● 盘点 ● 退货 ● 调价 MFC 和我们的 C++最非常契合的 ● C++ ...

从头开始学Java【1】

1:常见的DOS命令盘符的切换 d:回车目录的进入 cd javase cd javase\day01\code 目录的回退 cd.. cd\ 清屏 cls 退出 exit 创建目录 md 删除目 ...

好纠结啊，JEECG 商业版本和开源版本有什么区别呢？

2014-12-18 jeecg JEECG 小J博士来给你解答: 商业版本独有功能:1.流程设计器 2.集成工作流引擎activit,智能化封装,在线配置表单,在线设计流程,流程和表单挂接,给任意节 ...

2015 11 26 java 配置环境变量

使用java软件, 须进行改变配置环境变量.需要2步. 第一,在电脑中找到配置环境变量的位置: 我的电脑,属性,高级,环境变量. 第二,进行添加两个变量,更改一个变量: 1,变量名:JAVA_HOME ...

Oracle中merge into的使用

http://blog.csdn.net/yuzhic/article/details/1896878 http://blog.csdn.net/macle2010/article/details/5 ...

[Minecraft.net]官网文章代码模板

[postbg]bg9.png[/postbg][align=center][img]<题图链接>[/img][/align] [align=center][font=微软雅黑][size ...

《UML大战需求分析》阅读笔记3

流程分析利器--活动图活动图属于行为建模的一种.用来分析的不是系统中的某个属性,而是系统或是其中某个部分的活动.结构建模表达的是静态内容,行为建模表达的是动态内容. 在介绍活动图之前,先介绍一下行为 ...

恐论烟且宪y43p4m2s1hw33e1l

"比赛将进行抽签,每一组学员至少要进行十场战斗.最终按胜场进行排名.其中,最后排名前六十四位的团队将进行淘汰赛,淘汰赛的前四名学院将会分别有不同的奖励.冠军团队的奖励将会十分珍稀." ...

对本程序使用自己的代理服务器

int __fastcall XSetProxy(void) { // TODO: 设置代理服务器. //返回错误代码: //0:不使用代理 -1: TIniFile *ReadIni = new T ...

hive-0.13固化自定义UDF

之前帮业务方固化过hive-0.7的自定义的UDF,由于现在大部分业务数据都已经迁移到hadoop2.4.0,hive使用的版本是0.13,之前固化的UDF不能用了,让在0.13上面也固化一下,以下是 ...

Android实现程序前后台切换效果

转载自:http://www.cnblogs.com/hanyonglu/archive/2012/04/15/2450551.html 本文演示如何在Android中实现程序前后台切换效果. 在介绍 ...

每天laravel-20160627|TaggableStore

<?php namespace Illuminate\Cache; // a namespace abstract class TaggableStore { /** * Be ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.