读paper笔记

转载注明来自cnblog:sciencefans

由于一些原因,这两天要复习20篇paper。做好计划就趁热打铁,先复习一下去年刚接触到PR读的第一篇《Blessing of Dimensionality: High-dimensional Feature and Its Efficient Compression for Face Verification 》

这篇文是MSRA的sunjian组发在CVPR13上的。下面直接跳过intro和related work。

首先介绍了high-dimensional是怎么构建的:

1.Dense landmarks=27(这一数字可以变成68,更快的算法参考CVPR2014中3000FPS那篇文的算法);

2.Multiple scales.在图像金字塔中选取了数个不同尺度的图像。

基于以上两点,作者以一张图的27个特征点为中心,建立了27个矩阵,每个矩阵划分成4*4的子矩阵,然后统计标准化的LBP直方图特征,构成high-dimensional特征。

紧接着,作者又说这么长的特征肯定是sparse的,于是要好好降一发维。怎么降呢?此时算法兵分两路:

1.先PCA一发压缩特征矩阵(维数*样本数),然后LDA一发或者joint bayesian一发来找出类间信息以及进一步降维。

这样做可以给训练数据降维,但是测试数据咋办呢?没有label没法做LDA啊~于是作者想到了一个ingenious的方法:

2.学习一个叫做sparse linear projection的东东,说白了就是降维矩阵。这是重头戏。下面介绍如何学习该矩阵:

要求降维矩阵,实际上就是要使得如下目标函数的最小值时B的解:

其中Y是经过pca那些东西压缩后的训练数据的矩阵,X是原始高维训练矩阵。

后面那个东东叫做lasso回归惩罚因子,好吧本身这个目标函数就是lasso回归,也叫l1回归,因为后边的项是一个一阶范数。这样做可以让B更加稀疏。获取X中更有效的成分。

但是考虑到通常计算距离的尺度(欧几里得距离或者cos距离)是具有旋转不变性的,所以Y也需要承上一个旋转变换矩阵来维持这种不变形。于是这个目标函数就变成了:

之后就是求B和R了,已知B求R和已知R求B是比较简单的问题,通过迭代优化这俩子问题就可以得到B和R。

好了,总结一下,首先通过PCALDA一类的东西把高位训练特征转化到低维空间,然后通过原训练矩阵X和压缩后的训练矩阵Y搞出来B和R,这样再来一发测试矩阵Z的时候,直接B‘Z就可以得到压缩后的测试矩阵了。简直神了~

流程图如下:

好了,说了这么多,结果咋样呢?当年的state-of-the-art。提高了3个百分点左右。

先写这么多啦~

时间: 2024-12-21 11:17:00

读paper笔记的相关文章

Xie Tao的几个小建议PPT:关于读Paper,如何与他人交流,赶Deadline

Xie Tao 给出了一些建议: 关于读Paper: 做一个5行的小笔记备查 关于与他人交流:保证逻辑性: 自上而下,不要过于关注技术细节: 提供背景知识和上下文,方便对方理解: 回答问题时需要有逻辑. 关于赶Dean line: 学生独立完成论文草稿及早发给合作者,收集反馈意见: 保证邮件畅通,及早回复: 下面是PDF文件链接 http://files.cnblogs.com/yulele/ThreeTipsFromTaoXie.pdf

读论文笔记

最近开始认真的去读论文了,而且慢慢读出了一点味道,首先最基本的读的速度变快了,可能是因为读的这几篇论文里重复的单词比较多,,,,害怕读的论文,过了一段时间又给忘了,所以一点一点记下来. 我做的毕设是彩色水果图像的分割嘛,所以先读的论文自然都是和水果有关的,去那些数据库搜索文献,关键词就是 fruit image segmentation. 1      <Object Segmentation For Fruit Image Using OHTA Color Space and Cascade

读ecshop笔记(一)

__FILE__:获取文件绝对路径:D:\WWW\ecshop\admin\includes\init.php dirname(__FILE__):这个文件所在文件夹的绝对路径:D:\WWW\ecshop\admin\includes ini_set 函数格式: string ini_set(string $varname, string $newvalue) //@符号代表不输出错误. @ini_set(string $varname, string $newvalue) ini_set用来设

读paper:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, andScore-level Fusion for Face Recognition

今天给大家带来一篇来自CVPR 2017关于人脸识别的文章. 文章题目:Deep Convolutional Neural Network using Triplets of Faces, Deep Ensemble, and 摘要: 文章动机:人脸识别在一个没有约束的环境下,在计算机视觉中是一个非常有挑战性的问题.同一个身份的人脸当呈现不同的装饰,不同的姿势和不同的表情都可以使人脸看起来完全不同.这种相同身份的变化可以压倒不同身份的变化,这样给人脸识别带来更大的挑战,特别是在没有约束的环境下.

Paper Reading_SysML

最近(以及预感接下来的一年)会读很多很多的paper......不如开个帖子记录一下读paper心得 SysML相关的文章很多来源于上学期的8980课.有些和具体field(比如DB/architecture/...)相关的就放到各个field的分类里啦,这里放一些不好分类的 Class Blog Virtual Address Translation via Learned Page Table Indexes 在页表中使用learned index. 笔记在这里:Link Represent

Paper Reading_ML for system

最近(以及预感接下来的一年)会读很多很多的paper......不如开个帖子记录一下读paper心得 SysML相关的文章很多来源于上学期的8980课.有些和具体field(比如DB/architecture/...)相关的就放到各个field的分类里啦,这里放一些不好分类的 Class Blog Mark一个大神的Blog 再Mark一个大神的Blog Virtual Address Translation via Learned Page Table Indexes 在页表中使用learne

Paper Reading_Database and Storage System

最近(以及预感接下来的一年)会读很多很多的paper......不如开个帖子记录一下读paper心得 New Hardware / non volatile memory .... Streaming .... Cloud / Distributed PolarFS: An Ultra-low Latency and Failure ResilientDistributed File System for Shared Storage Cloud Database https://zhuanla

java之jvm学习笔记六(实践写自己的安全管理器)

安全管理器SecurityManager里设计的内容实在是非常的庞大,它的核心方法就是checkPerssiom这个方法里又调用AccessController的checkPerssiom方法,访问控制器AccessController的栈检查机制又遍历整个PerssiomCollection来判断具体拥有什么权限一旦发现栈中一个权限不允许的时候抛出异常否则简单的返回,这个过程实际上比我的描述要复杂得多,这里我只是简单的一句带过,因为这里涉及到很多比较后面的知识点. 下面来尝试一下写一个非常简单

AAAI 2016 paper阅读

本篇文章调研一些感兴趣的AAAI 2016 papers.科研要多读paper!!! Learning to Generate Posters of Scientific Papers,Yuting Qiang, Yanwei Fu, Yanwen Guo, Zhi-Hua Zhou and Leonid Sigal. http://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/aaai16poster.pdf 这篇paper研究从科技论文中生成海报