MDS(Multiple Dimensional Scalling)算法

MDS算法伪代码如下所示:

问题描述:如果知道美国若干个城市之间的距离,如何通过这些距离来刻画若干个城市之间的相对位置情况呢?

MDS算法是一种将多维的问题进行降低维度,以简化问题复杂度使得在有效时间内解决问题的方法。

解决问题的思路:原来距离矩阵的得到需要通过步骤X->B->D;现如今需要通过D->B->X‘的方法来得到一个低维度的X‘.

算法描述:

input:距离矩阵D是一个m*m矩阵,其元素distij是样本Xi到Xj间的距离,原来的问题维度为d,目标维度为d‘(d‘<d);

  • 求算B矩阵;
  • 对B矩阵进行特征值分解,得到特征值与特征向量
  • 取低于d的数目的最大特征值构成对角矩阵A,相对应的特征向量构成特征向量矩阵V

  output: 矩阵VA0.5是一个m*d‘的矩阵,每一行是所要求得低维坐标。

相关原理介绍与相关例子参见博客:

http://blog.csdn.net/Dark_Scope/article/details/53229427

时间: 2024-10-27 06:00:12

MDS(Multiple Dimensional Scalling)算法的相关文章

周志华 机器学习 笔记

首先的阶段由卷积层和池化层组成,卷积的节点组织在特征映射块(feature maps)中,每个节点与上一层的feature maps中的局部块通过一系列的权重即过滤器连接.加权和的结果被送到非线性函数中如ReLU.一个feature maps中所有的节点分享相同的过滤器,即共享权重.这种结构的原因是双重的,第一,图像中一个值附近的值是高度相关的,第二,不同区域的值是不相干的.换句话说,一个图像某部分出现的特征会在其他部分出现,因此可以实现权值共享并且检测到相同模式在矩阵的不同部分,这种操作在数学

菜鸟入门_Python_机器学习(4)_PCA和MDA降维和聚类

@sprt *写在开头:博主在开始学习机器学习和Python之前从未有过任何编程经验,这个系列写在学习这个领域一个月之后,完全从一个入门级菜鸟的角度记录我的学习历程,代码未经优化,仅供参考.有错误之处欢迎大家指正. 系统:win7-CPU; 编程环境:Anaconda2-Python2.7,IDE:pycharm5; 参考书籍: <Neural Networks and Learning Machines(Third Edition)>- Simon Haykin; <Machine L

6-10-HIRP OPEN 2016

1 HIRPO20160601: Large Scale Heterogeneous Data Processing Subject: resource scheduling It is also likely that the computing environment is heterogeneous. The cloudconsists of generations of servers with different capacities and performance;therefore

机器学习系统设计(Building Machine Learning Systems with Python)- Willi Richert Luis Pedro Coelho

机器学习系统设计(Building Machine Learning Systems with Python)- Willi Richert Luis Pedro Coelho 总述 本书是 2014 的,看完以后才发现有第二版的更新,2016.建议阅读最新版,有能力的建议阅读英文版,中文翻译有些地方比较别扭(但英文版的书确实是有些贵). 我读书的目的:泛读主要是想窥视他人思考的方式. 作者写书的目标:面向初学者,但有时间看看也不错.作者说"我希望它能激发你的好奇心,并足以让你保持渴望,不断探索

HDU2028 Lowest Common Multiple Plus【stein算法】【水题】

Lowest Common Multiple Plus Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 36800    Accepted Submission(s): 15116 Problem Description 求n个数的最小公倍数. Input 输入包含多个测试实例,每个测试实例的开始是一个正整数n,然后是n个正整数. Ou

基于Multiple treatment的营销评估算法

营销是发现或挖掘准消费者和众多商家需求,通过对自身商品和服务的优化和定制,进而推广.传播和销售产品,实现最大化利益的过程.例如,银行可通过免息卡或降价对处在分期意愿边缘的用户进行营销,促使其分期进而提升整体利润:选择最优时机和地点对用户进行广告投放提升转化. 在大数据和"千人千面"的背景下,营销升级为"精准营销",对每个用户的需求进行更加精细的个性化分析与投放,进而实现用户满意,广告主和平台获益的多赢局面.营销算法的步骤一般为:1) 圈人,2) 召回和排序 3) 在

Linear regression with multiple variables(多特征的线型回归)算法实例_梯度下降解法(Gradient DesentMulti)以及正规方程解法(Normal Equation)

%第一列为 size of House(feet^2),第二列为 number of bedroom,第三列为 price of House 1 2104,3,399900 2 1600,3,329900 3 2400,3,369000 4 1416,2,232000 5 3000,4,539900 6 1985,4,299900 7 1534,3,314900 8 1427,3,198999 9 1380,3,212000 10 1494,3,242500 11 1940,4,239999 1

机器学习算法之旅(转载)

http://machinelearningmastery.com/a-tour-of-machine-learning-algorithms/ In this post, we take a tour of the most popular machine learning algorithms. It is useful to tour the main algorithms in the field to get a feeling of what methods are availabl

高维数据的快速最近邻算法FLANN

1.     简介 在计算机视觉和机器学习中,对于一个高维特征,找到训练数据中的最近邻计算代价是昂贵的.对于高维特征,目前来说最有效的方法是 the randomized k-d forest和the priority search k-means tree,而对于二值特征的匹配 multiple hierarchical clusteringtrees则比LSH方法更加有效. 目前来说,fast library for approximate nearest neighbors (FLANN)