ScSPM & LLC

为啥会有SPM→ScSPM呢?原因之一是为了寻找better coding + better pooling的方式提高性能,原因之二就是提高速度。如何提高速度?这里的速度,不是Coding+Pooling的速度,而是分类器的速度。SPM设计的是一个Linear feature,在文章中作者用于实验则是用了nonlinear SVM(要用Mercer Kernels)。相比linear SVM,nonlinear SVM在training和testing的时候速度会慢的。至于其原因,我们不妨看看SVM的对偶形式:

(1)

如果核函数是一个线性的kernel:K(z, zi)=zTzi,那么SVM的决策函数就可以改写为:

    (2)

从两式可以看见,抛开训练和存储的复杂度不说,对于测试来说,(1)式对每个测试样本要单独计算K(z, zi),因此testing的时间复杂度为O(n)。而(2)式的wT可以一次性事先算出,所以每次testing的时间复杂度为O(1)。此外,linear classifier的可扩展性会更好。

因此,如果能在coding+pooling后设计得到线性可分的特征描述,那就最好了。因此能否设计一个nonlinear feature + linear SVM得到与 linear feature + nonlinear SVM等效甚至更好的效果,成为ScSPM和LLC的研究重点。

ScSPM

SPM在coding一步采用的是Hard-VQ,也就是说一个descriptor只能投影到dictionary中的一个term上。这样就造成了明显的重建误差(worse reconstruction,large quantization errors)。这样,原本很相似的descripors经过coding之后就会变得非常不相似了。ScSPM为此取消了这一约束,它认为descripor可以投影到某几个terms上,而不仅仅是一个。因此,其目标函数变成了:

     (3)

其中M是descriptor的数目,Um表示第m个descriptor在字典V上的投影系数。

它对投影系数用L1-norm做约束实现了稀疏。求解问题称为LASSO (least absolute shrinkage and selection operator),在得到稀疏结果的同时,它无法得到解析解,因此速度肯定是很慢的。关于L1-norm和LASSO问题,可以参看这里

为什么Sparse Coding好,主要有以下几个原因:

1)已经提到过的重建性能好;[2]

2)sparse有助于获取salient patterns of descripors;[2]

3)image statistics方面的研究表明image patches都是sparse signals;[2]

4)biological visual systems的研究表明信号的稀疏特征有助于学习;[4]

5)稀疏的特征更加线性可分。[2]

总之,"Sparse coding is a better building block“。

Coding过后,ScSPM采用的Pooling方法是max pooling:Zj=max Uij。相比SPM的average pooling:Zj=1/M *Σ Uij。可以看见average pooling是一个linear feature representation,而max pooling是nonlinear的。

作者在实验中得出max pooling的效果好于average pooling,原因是max pooling对local spatial variations比较鲁棒。而Hard-VQ就不好用max pooling了,因为U中各元素非0即1。

另外实验的一个有趣结果是发现 ScSPM对大的codebook size表现出更好的性能,反观SPM,codebook大小对SPM结果影响不大。

LLC

LLC和ScSPM差不多了,也是利用了Sparsity。值得一说的是,其实Hard-VQ也是一种Sparse Coding,只不过它是一种重建误差比较大的稀疏编码。LLC对ScSPM的改进,则在于引入了locality。为了便于描述,盗用一下论文的图:

图(4)

这个图实在是太棒了,太能解释问题了。VQ不用说,重点在于SC和LLC之间,LLC引入了locality的约束,即不仅仅是sparse要满足,非零的系数还应该赋值给相近的dictionary terms。作者在[4]中解释到,locality 很重要是因为:

1)nonlinear function的一阶近似要求codes是local的;

2)locality能够保证codes的稀疏性,而稀疏却不能保证locality;

3)稀疏的coding只有再codes有局部性的时候有助于learning。

总之,"locality is more essential than sparsity"。

LLC的目标函数是:

     (4)

和(3)一样,(4)可以按照加号的前后分成两部分:加号前的一项最小化是为了减少量化误差(学习字典、确认投影系数);加号后的一项则是做出假设约束(包括是一些参数的regularization)。这个求解是可以得到闭合解的,同时也有快速的近似算法解决这个问题,因此速度上比ScSPM快。

di描述的是xi到每个dictionary term的距离。显然这么做是为了降低距离大的term对应的系数。

总结

ScSPM 主要改进了SPM的硬投票的方式

可以把,ScSPM 和 LLC 理解为特征的编码方式 —— 也就是给出一个新的特征向量,如何用之前聚类出的codebook表示 —— VQ是硬投票(最近邻原则找到距离最近的一个code),ScSPM软投票(由不同code的组合表示且做了稀疏性约束),LLC 软投票(locality 约束)

转自:http://blog.csdn.net/jwh_bupt/article/details/9837555

时间: 2024-10-12 09:55:31

ScSPM & LLC的相关文章

图像的稀疏表示——ScSPM和LLC的总结

图像的稀疏表示——ScSPM和LLC的总结 稀疏编码系列: (一)----Spatial Pyramid 小结 (二)----图像的稀疏表示——ScSPM和LLC的总结 (三)----理解sparse coding (四)----稀疏模型与结构性稀疏模型 --------------------------------------------------------------------------- 前言 上一篇提到了SPM.这篇博客打算把ScSPM和LLC一起总结了.ScSPM和LLC其实

LLC DISCARDED信令消息

LLC Discarded 消息的出现主要是由于 PCU 将部分信令包丢失掉,这种情况会影响到 GPRS 的各项业务的性能.例如在日常的 WAP 测试时就会由于 LLC Discarded 导致 WAP 首页显示时间比较长. 大部份产生 LLC Discarded 的小区在做Radio Status 统计时排名也靠前.这样可以说明 LLC Discarded 和 Radio Stauts是有相关性的 .

ScSPM

引入 Recently SVMs using spatial pyramid matching (SPM) kernel have been highly successful in image classification. Despite its popularity, these nonlinear SVMs have a complexity in training and O(n) in testing, where n is the training size, implying t

LLC子层为什么不在数据包中体现?LLC子层具体作用是什么?Ethernet_II如何表示帧结束?

前言:LLC子层看懂了又忘记,写在这里方便记忆. MAC就不说了.LLC格式百度. LLC子层 IEEE802.3帧中的LLC子层除了定义传统的链路层服务之外,还增加了一些其他有用的特性.这些特性都由DSAP.SSAP和Control字段提供. 例如以下三种类型的点到点传输服务: 无连接的数据包传输服务 目前的以太网实现就是这种服务. 面向连接的可靠的数据传输服务 预先建立连接再传输数据,数据在传输过程中可靠性得到保证. 无连接的带确认的数据传输服务. 该类型的数据传输服务不需要建立连接,但它在

C++实现CVPR2010 LLC(局部约束线性编码)

<div style="orphans: auto; widows: 1;"><span style="font-family:Times New Roman;font-size:18px;"><strong></strong></span></div><span style="font-family:Times New Roman;font-size:18px;"&g

gem5: 实现最后一级缓存LLC分区

问题:如何实现cpu中最后一级缓存分区呢?如对于LLC 2MB,cache line 64Byte, 32-way,将其分区为16路相连并保持1024 cache sets不变呢? 比如下面的4个set, 8路相连,分区后变成4路有效(标志为1的)的cache. 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 1 1 1 1 0 0 0 0 思路: 分区的关键部分包含lru.cc和CacheSet.hh: lru.cc中关于访问accessBloc

LLC 逻辑链路控制

LLC  协  议 4.2.1 LLC帧格式 LLC协议定义了LLC层之间通信的帧格式,参见图4.3. 图4.3  LLC帧格式 LLC帧格式中各个字段的含义如下: ① 服务访问点(SAP)地址:SAP提供了多个高层协议进程共同使用一个LLC层实体进行通信的机制.在一个网络节点上,一个LLC层实体可能同时为多个高层协议提供服务.为此,LLC协议定义了一种逻辑地址SAP及其编码机制,允许多个高层协议进程使用不同的SAP地址来共享一个LLC层实体进行通信,而不会发生冲突.SAP机制还允许高层协议进程

professional training &amp; coaching company list - Success Resources USA, LLC

Cheetah Digital | computer software CRF Health | information technology and services Dassault Systèmes 3DEXCITE | information technology and services Aurigo Software Technologies | computer software Sensis | marketing and advertising United Space All

电力电子实验 LLC半桥谐振变换器 记录

原文地址:https://www.cnblogs.com/QQ2962269558/p/10921881.html