稀疏表示 过完备 字典

2基于局部时窄特征的动作识别模哩
2.1
动作识别的基本思想
实现了基于时空兴趣点和时空单词的动作表示和识别方法,该方法首先通过训练从样本中提取出准确的时空兴趣点,
建立基于兴趣点特征的时空码本,并构造出动作分类器。在动作识别过程中,计算待分类视频中的兴趣点特征和时空码
本的距离对兴趣点进行分类,生成对视频动作进行表征的时空单词,最后通过动作分类器进行分类识别。

目前已有很多方法和技术用于构造分类模型,决策树、神经网络、贝叶斯方法、Fisher线性分析(Fld)以及支持向量机(Support
Vector Machine, SVM)。

基于超完备字典的信号稀疏分解是一种新的信号表示理论,其采用超完备的冗余函数系统代替传统的正交基函数,为信号自适应的稀疏扩展提供了极大的灵活性。稀疏分解可以实现数据压缩的高效性,更重要的是可以利用字典的冗余特性捕捉信号内在的本质特征。

信号稀疏分解的基本思想是:使用超完备的冗余函数字典作为基函数,字典的选择尽可能地符合被逼近信号的结构,字典中的元素被称为原子。利用贪婪算法或者自适应追踪算法,从字典中找到具有最佳线性组合的很少的几项原子来表示一个信号,也称作高度非线性逼近。本文主要利用字典的冗余特性可以更好地捕捉信号本质特征这一特点,提出数据分类算法SRC。实验结果表明,SRC算法在分类准确性上优于SVM和Fld算法,不平衡数据集的分类实验结果显示了该算法的鲁棒性。

几个专业名词解析:

原子:字典的列向量。

完备字典与过完背字典:如果字典D中的原子恰能够张成n维的欧式空间,则字典D是完备的。如果m》n,字典D是冗余的,同时保证还能张成n维

的欧式空间,则大字典D是过完备的。

面对稀疏表示模型,有三个关键问题需要解决,如下:

1.如何有效获取图像在字典中下最稀疏的分解系数。2.如何设计与构建有效的图像稀疏表示字典。3.如何将图像稀疏表示模型应用于具体的图像处理反问题中。

首先,Dictionary是一种sparse
representation(稀疏表示)的模型。比如你的数据是y,字典是D,y=Dx,其中x是稀疏的。

果你的D是方阵或者长方形矩阵(正交矩阵除外),字典很可能是不确定的。相反的,如果你的D是个fat matrix
冗余矩阵,形象地讲,你拥有多于必要的列来表达这个数据(冗余)。这样的字典称为Overcomplete
dictionary。
这种字典的优势是更有利于表达highly diversified(高度多元化)的数据(图像)。

转自http://blog.csdn.net/jwh_bupt/article/details/9969841

特征学习的过程中,假设学习的码书D的大小为M。每个码字的维数为N。每个原始特征Yi的维数也为N。假设原始特征投影到码书上以后的特征向量是Xi(M维的矢量),那么用D和Xi对Yi重建的过程就是:Yi=D*Xi。

coding的过程就变成了已知Yi和D,求Xi的过程了。显然这是一个非齐次方程组求解的
问题,方程组有解的条件是rank(D)≤M,其中取等号时方程组有唯一解。过完备的定义是M>>N,所以此时
rank(D)≤N<<M,此时方程组有无穷多解。(你可能会问,这和最小化平方误差为目标函数不一样啊!其实求个导,就变成这个方程组
了。)这就是过完备造成的问题了。怎么办呢?办法就是对Xi做约束------稀疏的约束,这样Xi就有唯一解了。这就是需要加约束的原因。而为什么是稀
疏的约束,这在我前两博客(这里这里)中稍微介绍过,这里就不再废话。

  特征选择的过程,也是一样的。假设此时有n个样本,每个样本有个measurement(这个measurement可以是regression中的output,也可以是classification中的label)。每个样本的特征是p维的,n个样本的特征组成n*p的矩阵A。目标是对这p维特征做一个选择,选择的系数用x记录。此时将如下图所示:

这与第一个图是等价的,特征选择过程中的over-complete是指p>>n,不加约束的情况下x将有无穷多组解,所以和特征学习一样,
加系数的约束。xi为0表示相应的特征不被选择。(而xi<0,等价于取一个|xi|,而将相应的特征的值取负号。)

如果measurement不是一维的咋办?比如multi-label的问题。我猜测把x的列维数也扩展成相应大小,然后根据label之间的correlation加低秩等约束吧。

转自http://blog.csdn.net/carson2005/article/details/7989675

稀疏表示是最近几年信号处理领域的热点之一,简单来说,它其实是一种对原始信号的分解过程,该分解过程借助一个事先得到的字典(也有人称之为过完备基,overcomplete basis,后面会介绍到),将输入信号表示为字典的线性近似的过程。即:

稀疏表示 过完备 字典,布布扣,bubuko.com

时间: 2024-10-13 15:48:32

稀疏表示 过完备 字典的相关文章

IEEE Trans 2006 使用K-SVD构造超完备字典以进行稀疏表示(稀疏分解)

K-SVD可以看做K-means的一种泛化形式,K-means算法总每个信号量只能用一个原子来近似表示,而K-SVD中每个信号是用多个原子的线性组合来表示的. K-SVD算法总体来说可以分成两步,首先给定一个初始字典,对信号进行稀疏表示,得到系数矩阵.第二步根据得到的系数矩阵和观测向量来不断更新字典. 设D∈R n×K,包含了K个信号原子列向量的原型{dj}j=1K,y∈R n的信号可以表示成为这些原子的稀疏线性结合.也就是说y=Dx,其中x∈RK表示信号y的稀疏系数.论文中采用的是2范数来计算

稀疏学习之设计字典

稀疏信号的一个最重要的部分就是字典A.那么选择A?怎么样选择才是合理? 一.字典的选择和学习 如何选择合适的字典,一种基本的方法是选择预定义的字典,如无抽样小波.可操纵小波.轮廓博.曲波,等等.近期很多学者提出来主要针对图像的字典,特别是类似于“卡通”的图像内容,假设分段平滑并具有平滑边界. 这些提出的字典附有详细的理论分析,能够对简单信号建立稀疏表示系数.一个典型的应用时M项近似衰减率——用M个最佳的非零系数表示信号. 另一种选择字典的方法是可调节的——通过在特定参数(连续或者离散的)控制下生

聚类与稀疏表示

1.聚类与稀疏表示的关系 聚类,也可以称为向量量化(vector quantization,VQ),可以看作稀疏表示的一种特殊情况,反过来,稀疏表示则可以当成广义的聚类.在聚类中,每个样本(信号)都被表示成与之最近的码字(codeword),且系数为1:gain-shape VQ的系数可以使任意的,但是表示的codeword的数目也是一个,即也只能用一个codeword表示样本:而稀疏表示则是用原子字典中原子的线性组合来表示样本,即原子个数是任意的(但是是有限制的,否则稀疏表示没有意义),且系数

稀疏表示和字典学习

1. 引言 近年来,随着芯片.传感器.存储器以及其他硬件设备的快速发展,很多领域都面临着数据量过大.处理时间过长的问题.传统的信号处理方式已经无法满足人们对大量数据处理的需求,简洁.高效.稀疏的信号表示方法是人们研究.关注的热点.稀疏表示和字典学习方法在解决数据量过大的问题上有独特的优势,稀疏表示和字典学习方法最早用于压缩感知中信号处理问题,现在越来越多的研究者把稀疏表示用在图像处理.目标识别.机器视觉.音频处理等领域中.将稀疏表示和字典学习方法应用到图像处理上,可以简单.高效地将图像中的噪声分

Dictionary Learning(字典学习、稀疏表示以及其他)

第一部分 字典学习以及稀疏表示的概要 字典学习(Dictionary Learning)和稀疏表示(Sparse Representation)在学术界的正式称谓应该是稀疏字典学习(Sparse Dictionary Learning).该算法理论包含两个阶段:字典构建阶段(Dictionary Generate)和利用字典(稀疏的)表示样本阶段(Sparse coding with a precomputed dictionary).这两个阶段(如下图)的每个阶段都有许多不同算法可供选择,每种

稀疏编码之字典学习

稀疏信号的一个最重要的部分就是字典A.那么选择A?怎么样选择才是合理? 一.字典的选择和学习 如何选择合适的字典,一种基本的方法是选择预定义的字典,如无抽样小波.可操纵小波.轮廓博.曲波,等等.近期很多学者提出来主要针对图像的字典,特别是类似于“卡通”的图像内容,假设分段平滑并具有平滑边界. 这些提出的字典附有详细的理论分析,能够对简单信号建立稀疏表示系数.一个典型的应用时M项近似衰减率——用M个最佳的非零系数表示信号. 另一种选择字典的方法是可调节的——通过在特定参数(连续或者离散的)控制下生

7. 稀疏表示之OMP,SOMP算法及openCV实现

一.前言 稀疏表示是自上世纪90年代开始,从人眼的视觉感受野获得启示,逐渐被人们所研究.现在已经发展为一种重要的信息表示方法.所谓稀疏表示是指,一个信号在过完备字典中,可以由少数个原子线性表达, 其数学模型可以表达如下: 这个数学模型解算是一个NP-hard问题,也就是说只能通过穷举去获得最优解,其时间复杂度很大,几乎无法获得其精确的解算.在这种情况下,我们常用贪婪算法去获得该模型的次最优解.本文介绍一种主流的贪婪算法—— 正交匹配追踪(OMP). 二.OMP算法 贪婪算法的核心是每次从字典的原

什么是稀疏表示

参考文献:百度文库 历史: 1993年,Mallat基于小波分析提出了信号可以用一个超完备字典进行表示,从而开启了稀疏表示的先河 背景: 在20年中,信息稀疏表示,信息处理领域广受关注 目的: 在一个超完备字典中,用尽可能少的原子来表示,从而获得更简单的表达方式,这对信息的处理,压缩,编码及其有用.我的理解是,在一堆要表达的信息中,我们希望用最少的原料来表示这一堆中任何一个信息样例,这有点像坐标的基,只不过这里稀疏表达可能允许工程近似.譬如,一个平面上的点信息,有无数个点,而我建立坐标系之后(甚

稀疏表示(Sparse Representations)

1.什么是稀疏表示: 用较少的基本信号的线性组合来表达大部分或者全部的原始信号. 其中,这些基本信号被称作原子,是从过完备字典中选出来的:而过完备字典则是由个数超过信号维数的原子聚集而来的.可见,任一信号在不同的原子组下有不同的稀疏表示. 假设我们用一个M*N的矩阵表示数据集X,每一行代表一个样本,每一列代表样本的一个属性,一般而言,该矩阵是稠密的,即大多数元素不为0. 稀疏表示的含义是,寻找一个系数矩阵A(K*N)以及一个字典矩阵B(M*K),使得B*A尽可能的还原X,且A尽可能的稀疏.A便是