拉普拉斯特征图降维及其python实现

这种方法假设样本点在光滑的流形上,这一方法的计算数据的低维表达,局部近邻信息被最优的保存。以这种方式,可以得到一个能反映流形的几何结构的解。

步骤一:构建一个图G=(V,E),其中V={vi,i=1,2,3…n}是顶点的集合,E={eij}是连接顶点的vi和vj边,图的每一个节点vi与样本集X中的一个点xi相关。如果xi,xj相距较近,我们就连接vi,vj。也就是说在各自节点插入一个边eij,如果Xj在xi的k领域中,k是定义参数。

步骤二:每个边都与一个权值Wij相对应,没有连接点之间的权值为0,连接点之间的权值:

步骤三:令实现广义本征分解:

使是最小的m+1个本征值。忽略与=0相关的本征向量,选取另外m个本征向量即为降维后的向量。

2.1、python实现拉普拉斯降维

def laplaEigen(dataMat,k,t):

m,n=shape(dataMat)

W=mat(zeros([m,m]))

D=mat(zeros([m,m]))

for i in range(m):

k_index=knn(dataMat[i,:],dataMat,k)

for j in range(k):

sqDiffVector = dataMat[i,:]-dataMat[k_index[j],:]

sqDiffVector=array(sqDiffVector)**2

sqDistances = sqDiffVector.sum()

W[i,k_index[j]]=math.exp(-sqDistances/t)

D[i,i]+=W[i,k_index[j]]

L=D-W

Dinv=np.linalg.inv(D)

X=np.dot(D.I,L)

lamda,f=np.linalg.eig(X)

return lamda,f

def knn(inX, dataSet, k):

dataSetSize = dataSet.shape[0]

diffMat = tile(inX, (dataSetSize,1)) - dataSet

sqDiffMat = array(diffMat)**2

sqDistances = sqDiffMat.sum(axis=1)

distances = sqDistances**0.5

sortedDistIndicies = distances.argsort()

return sortedDistIndicies[0:k]

dataMat, color = make_swiss_roll(n_samples=2000)

lamda,f=laplaEigen(dataMat,11,5.0)

fm,fn =shape(f)

print ‘fm,fn:‘,fm,fn

lamdaIndicies = argsort(lamda)

first=0

second=0

print lamdaIndicies[0], lamdaIndicies[1]

for i in range(fm):

if lamda[lamdaIndicies[i]].real>1e-5:

print lamda[lamdaIndicies[i]]

first=lamdaIndicies[i]

second=lamdaIndicies[i+1]

break

print first, second

redEigVects = f[:,lamdaIndicies]

fig=plt.figure(‘origin‘)

ax1 = fig.add_subplot(111, projection=‘3d‘)

ax1.scatter(dataMat[:, 0], dataMat[:, 1], dataMat[:, 2], c=color,cmap=plt.cm.Spectral)

fig=plt.figure(‘lowdata‘)

ax2 = fig.add_subplot(111)

ax2.scatter(f[:,first], f[:,second], c=color, cmap=plt.cm.Spectral)

plt.show()

2.2、拉普拉斯降维实验

用如下参数生成实验数据存在swissdata.dat里面:

def make_swiss_roll(n_samples=100, noise=0.0, random_state=None):

#Generate a swiss roll dataset.

t = 1.5 * np.pi * (1 + 2 * random.rand(1, n_samples))

x = t * np.cos(t)

y = 83 * random.rand(1, n_samples)

z = t * np.sin(t)

X = np.concatenate((x, y, z))

X += noise * random.randn(3, n_samples)

X = X.T

t = np.squeeze(t)

return X, t

实验结果如下:

N=5,t=15:             N=7,t=15:            N=9,t=15:

N=11,t=15:             N=13,t=15:            N=15,t=15:

N=17,t=15:             N=19,t=15:            N=21,t=15:

N=23,t=15:             N=25,t=15:            N=27,t=15:

N=29,t=15:             N=31,t=15:            N=33,t=15:

N=25,t=5:              N=25,t=8:           N=25,t=10:

N=25,t=12:            N=25,t=14:               N=25,t=50:

N=25,t=Inf:

时间: 2024-08-27 18:12:11

拉普拉斯特征图降维及其python实现的相关文章

任务5 图像的读取及表示 图像的特征 图片特征的降维

任务目的: 知道图像的表示以及读取方法 了解图像的特征 对图像特征进行降维 一.图像的读取及表示 图像要进行处理才能进行模型输入. python自带的库将图像存在矩阵或者张量里面. 图像由像素组成,一个像素点一般油RGB三维数组构成. 二.图像的特征 图像的识别should环境因素约束. 常见的图像颜色特征有:SIFT尺度不变特征变换 和 HOG方向梯度直方图 颜色特征就是对RGB做一个统计,统计有各颜色的分布百分比. 前者具有尺度不变性,即使改变旋转角度,图像亮度或拍摄视角依然能够很好地识别.

SLAM概念学习之特征图Feature Maps

特征图(或者叫地标图,landmark maps)利用参数化特征(如点和线)的全局位置来表示环境.如图1所示,机器人的外部环境被一些列参数化的特征,即二维坐标点表示.这些静态的地标点被观测器(装有传感器的机器人)利用多目标跟踪的方法跟踪,从而估计机器人的运动. Fig.1 Feature maps. 机器人的定位是通过建立传感器观测特征和图map中特征之间的关系来确定的.预测特征的位置和量测特征位置之间的差别被用来计算机器人的位姿.这种方式,类似于多目标跟踪问题,但是不想传统的多目标跟踪问题,这

以图搜图(一):Python实现dHash算法(转)

近期研究了一下以图搜图这个炫酷的东西.百度和谷歌都有提供以图搜图的功能,有兴趣可以找一下.当然,不是很深入.深入的话,得运用到深度学习这货.Python深度学习当然不在话下. 这个功能最核心的东西就是怎么让电脑识别图片. 这个问题也是困扰了我,在偶然的机会,看到哈希感知算法.这个分两种,一种是基本的均值哈希感知算法(dHash),一种是余弦变换哈希感知算法(pHash).dHash是我自己命名的,为了和pHash区分.这里两种方法,我都用Python实现了^_^ 哈希感知算法基本原理如下: 1.

卷积核输出特征图大小的计算

先讲一下是怎么卷积的.一般输入的是RGB颜色空间的图片,即有三个通道.可以理解为这三个通道的每个对应的数值组合在一起表示了这一张图片. 卷积操作过程:(通道数变化的原理) 先从一张示意图说起,卷积基础概念和操作步骤就不啰嗦了,只讲这张图,大意就是,有in-channel,有out-channel,你需要把in-channel都做卷积操作,然后产出out-channel,所以这个w是要层层拆解,w分拆成w0和w1,以对应2个out-channel.w0分拆成3个矩阵w0[:,:,0].w0[:,:

一秒钟带你走进P图世界-----(python)PIL库的使用

python-----PIL库的使用 一.什么是PIL库 1.PIL(Python Image Library)库是python语言的第三方库,具有强大的图像处理能力,不仅包含了丰富的像素.色彩操作功能,还可以用于图像的归档和批量处理能力. 2.PIL库主要有2个方面的功能: (1) 图像归档:对图像进行批处理.生产图像预览.图像格式转换等. (2) 图像处理:图像基本处理.像素处理.颜色处理等. 根据功能的不同,PIL库包括21个与图片相关的类,这些类可以被看作是子库或PIL库中的模块,例如:

使用二阶微分锐化图像(拉普拉斯算子)基本原理及Python实现

1. 拉普拉斯算子 1.1 简介 一种典型的各向同性的微分算子,可用于检测图像中灰度图片的区域 $$ \nabla^{2} f=\frac{\partial^{2} f}{\partial x^{2}}+\frac{\partial^{2} f}{\partial y^{2}} $$ 根据上述的差分近似可以推导出 $$ \nabla^{2} f(x, y)=f(x+1, y)+f(x-1, y)+f(x, y+1)+f(x, y-1)-4 f(x, y) $$ 1.2 锐化过程 使用拉普拉斯过滤

一图看懂Python生态圈图像格式转换

在Python生态圈里,最常用的图像库是PIL--尽管已经被后来的pillow取代,但因为pillow的API几乎完全继承了PIL,所以大家还是约定俗成地称其为PIL.除PIL之外,越来越多的程序员习惯使用openCV来处理图像.另外,在GUI库中,也有各自定义的图像处理机制,比如wxPyton,定义了wx.Image做为图像处理类,定义了wx.Bitmap做为图像显示类. 下图梳理出了PIL读写图像文件.cv2读写图像文件.PIL对象和cv2对象互转.PIL对象和wx.Image对象互转.以及

三张图告诉你python爬虫时转换\u中文字符的“坑”

一劳永逸的方法: s=s.replace("'",'"') s=s.replace("\n",'') s1="u'"+s+"'" try: ss=eval(s1) except: return 将'转换为",将\n去掉.利用eval转化即可.

Laplacian eigenmap 拉普拉斯特征映射

下面是实验室大牛师兄自己写的一段总结,主要内容是Laplacian Eigenmap中的核心推导过程. 有空还是多点向这位师兄请教,每次都会捡到不少金子. Reference : <Laplacian Eigenmaps for Dimensionality Reduction and Data Representation>,2003,MIT