读paper笔记

转载注明来自cnblog:sciencefans

由于一些原因，这两天要复习20篇paper。做好计划就趁热打铁，先复习一下去年刚接触到PR读的第一篇《Blessing of Dimensionality: High-dimensional Feature and Its Efficient Compression for Face Verification 》

这篇文是MSRA的sunjian组发在CVPR13上的。下面直接跳过intro和related work。

首先介绍了high-dimensional是怎么构建的：

1.Dense landmarks=27(这一数字可以变成68，更快的算法参考CVPR2014中3000FPS那篇文的算法)；

2.Multiple scales.在图像金字塔中选取了数个不同尺度的图像。

基于以上两点，作者以一张图的27个特征点为中心，建立了27个矩阵，每个矩阵划分成4*4的子矩阵，然后统计标准化的LBP直方图特征，构成high-dimensional特征。

紧接着，作者又说这么长的特征肯定是sparse的，于是要好好降一发维。怎么降呢？此时算法兵分两路：

1.先PCA一发压缩特征矩阵（维数*样本数），然后LDA一发或者joint bayesian一发来找出类间信息以及进一步降维。

这样做可以给训练数据降维，但是测试数据咋办呢？没有label没法做LDA啊~于是作者想到了一个ingenious的方法：

2.学习一个叫做sparse linear projection的东东，说白了就是降维矩阵。这是重头戏。下面介绍如何学习该矩阵：

要求降维矩阵，实际上就是要使得如下目标函数的最小值时B的解：

其中Y是经过pca那些东西压缩后的训练数据的矩阵，X是原始高维训练矩阵。

后面那个东东叫做lasso回归惩罚因子，好吧本身这个目标函数就是lasso回归，也叫l1回归，因为后边的项是一个一阶范数。这样做可以让B更加稀疏。获取X中更有效的成分。

但是考虑到通常计算距离的尺度（欧几里得距离或者cos距离）是具有旋转不变性的，所以Y也需要承上一个旋转变换矩阵来维持这种不变形。于是这个目标函数就变成了：

之后就是求B和R了，已知B求R和已知R求B是比较简单的问题，通过迭代优化这俩子问题就可以得到B和R。

好了，总结一下，首先通过PCALDA一类的东西把高位训练特征转化到低维空间，然后通过原训练矩阵X和压缩后的训练矩阵Y搞出来B和R，这样再来一发测试矩阵Z的时候，直接B‘Z就可以得到压缩后的测试矩阵了。简直神了~

流程图如下：

好了，说了这么多，结果咋样呢？当年的state-of-the-art。提高了3个百分点左右。

先写这么多啦~

时间： 2024-12-21 11:17:00

读paper笔记的相关文章

Xie Tao的几个小建议PPT：关于读Paper，如何与他人交流，赶Deadline

Xie Tao 给出了一些建议: 关于读Paper: 做一个5行的小笔记备查关于与他人交流:保证逻辑性: 自上而下,不要过于关注技术细节: 提供背景知识和上下文,方便对方理解: 回答问题时需要有逻辑. 关于赶Dean line: 学生独立完成论文草稿及早发给合作者,收集反馈意见: 保证邮件畅通,及早回复: 下面是PDF文件链接 http://files.cnblogs.com/yulele/ThreeTipsFromTaoXie.pdf

读论文笔记

最近开始认真的去读论文了,而且慢慢读出了一点味道,首先最基本的读的速度变快了,可能是因为读的这几篇论文里重复的单词比较多,,,,害怕读的论文,过了一段时间又给忘了,所以一点一点记下来. 我做的毕设是彩色水果图像的分割嘛,所以先读的论文自然都是和水果有关的,去那些数据库搜索文献,关键词就是 fruit image segmentation. 1 <Object Segmentation For Fruit Image Using OHTA Color Space and Cascade

读ecshop笔记（一）

__FILE__:获取文件绝对路径:D:\WWW\ecshop\admin\includes\init.php dirname(__FILE__):这个文件所在文件夹的绝对路径:D:\WWW\ecshop\admin\includes ini_set 函数格式: string ini_set(string $varname, string $newvalue) //@符号代表不输出错误. @ini_set(string $varname, string $newvalue) ini_set用来设

读paper:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, andScore-level Fusion for Face Recognition

今天给大家带来一篇来自CVPR 2017关于人脸识别的文章. 文章题目:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, and 摘要: 文章动机:人脸识别在一个没有约束的环境下,在计算机视觉中是一个非常有挑战性的问题.同一个身份的人脸当呈现不同的装饰,不同的姿势和不同的表情都可以使人脸看起来完全不同.这种相同身份的变化可以压倒不同身份的变化,这样给人脸识别带来更大的挑战,特别是在没有约束的环境下.

读paper笔记

读paper笔记的相关文章

Xie Tao的几个小建议PPT：关于读Paper，如何与他人交流，赶Deadline

读论文笔记

读ecshop笔记（一）

读paper:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, andScore-level Fusion for Face Recognition

Paper Reading_SysML

Paper Reading_ML for system

Paper Reading_Database and Storage System

java之jvm学习笔记六(实践写自己的安全管理器)

AAAI 2016 paper阅读