多维尺度分析

我们知道对应分析是一种图示分析技术,通过对应分析图能够简单直观的将变量间的关系加以呈现,多维尺度分析和对应分析类似,也是将变量间的关系通过图形进行展现,关于二者的区别后面会做论述。

一、多维尺度分析简介
多维尺度分析Multidimensional Scaling,简称MDS,是一种探索性数据分析技术,主要是用适当的降维方法,将多个变量通过坐标定位在低维空间中(二维或三维),变量之间的欧氏距离就可以反映它们之间的差异性和相似性。

多维尺度分析根据数据集特征分为:
1.不考虑个体差异MDS模型
2.考虑个体差异MDS模型

MDS模型允许多种类型的数据输入,并且在实际应用中,也有多种测量相似性或差异性的方法,根据分析数据的类型分为:
1.度量化MDS模型:也称为古典MDS模型,所输入的数据是直接反映变量间差异或相似的距离或比率,例如城市间的距离就是现成的反映差异的数据。
2.非度量化MDS模型:输入的数据不是直接反映变量间的差异,而是通过对其属性的评分,间接的反映变量间的差异或相似性。

二、多维尺度分析的分析步骤

1.界定问题
明确研究的问题和范畴,确定相关的变量种类和数量

2.获取数据
根据实际情况获取分析数据

3.选择MDS模型
根据获得的数据类型,选择相应的MDS模型

4.确定维度
MDS模型是为了生成一个用尽可能小的维度对数据进行最佳拟合的空间感知图,因此要确定一个合适的维度,维度太高不易于解读,维度太低会影响拟合度,通常采用二维或三维。

5.模型评价
考察应力系数Stress和拟合指数RSQ,应力系数越小越好,RSQ越大越好

6.解读图表
多维尺度分析最重要的结果是感知图,图中各点之间的距离直接反映了各变量的相似或差异程度,除了查看差异程度之外,如果要对图表进行整体的分析解读,还需要对每个维度进行解释。

三、多维尺度分析与对应分析的异同

相同点:
1.都是可以得出有直观的图形结果,并且也都常用在市场分析中
2.都具有降维,数据浓缩的思想,实际上,多元统计分析都是基于将高维空间的数据压缩至低维空间进行分析。
3.二者基本上都属于描述性分析,都没有核心假设检验

不同点
多维尺度分析的目的是分析不同样本间的相似性或差异性,是针对样本的。对应分析的目的是分析不同变量之间的相关性,是针对变量的,因此在数据组成形式上,对应分析多为列联表形式,而多维尺度分析多为矩阵形式。

时间: 2024-10-10 10:14:32

多维尺度分析的相关文章

SPSS数据分析—多维尺度分析

在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型).多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性.探索性数据分析方法. 基于以上,我们可以得知,多维尺度分析经常使

多维尺度分析(Multidimensional scaling)与MATLAB实现

1. 几篇介绍很详细的博文 [1]http://blog.csdn.net/yang_xian521/article/details/7301121 模式识别之 MDS Multidimensional Scaling 多维尺度法 分析及Matlab实现 [2]http://blog.csdn.net/songrotek/article/details/42235097 MDS(multidimensional scaling)多维尺度分析 [3]http://blog.csdn.net/mag

多维尺度变换MDS(Multidimensional Scaling)

流形学习(Manifold Learning)是机器学习中一大类算法的统称,而MDS就是其中非常经典的一种方法. 多维尺度变换是一种在低维空间展示"距离"数据结构的多元数据分析技术,是一种将多维空间的研究对象简化到低维空间进行定位.分析和归类,同时又保留对象间原始关系的数据分析方法.多维尺度变换算法集中于保留高维空间中的"相似度"信息,而在一般的问题解决的过程中,这个"相似度"通常用欧式距离来定义. 通俗来讲,就是将多维数据映射到低维空间,同时保

模式识别之 MDS Multidimensional Scaling 多维尺度法 分析及Matlab实现

在模式识别中,我们会考虑到距离distance的问题,就是一个样本和另一个样本在空间中的距离.根据距离的大小来判断分类.那么,也存在这样的一类问题:我们只知道空间中的点(样本)的距离,那么怎么来重构这些点的相对位置呢? 显然欧式距离是最直观的距离,那么我们就会想使用欧式距离来进行计算重构,我们还希望能够在不同维度上进行重构,比如2维或者3维. 怎么做? 有这么个解决方法叫做MDS 全称为 Multidimensional Scaling. 下面Step By Step介绍MDS如何来求解这个问题

linux平台下server运维问题分析与定位

结合我工作中碰到的运维问题,总结一下Linux下server常见的运维问题以及定位方式.这里的server主要指自主开发的逻辑server,web srv因为通常采用通用的架构所以问题比较少. 逻辑server通常的处理能力在3k/s - 1w/s之间,因业务特点而不同.逻辑server一般是自主开发的,虽然在上线前大都经过功能和压力测试,但放到现网环境上部署后还是难免会出现一些问题,有些问题是在灰度发布时就可以发现,而有些问题则是一个漫长的暴露过程.下面先总结一下大致的问题分类和定位方法.  

某地市移动城域网络运维架构分析以及日常工作

1.某地市网络拓扑图2.地市出口设备分析地市的触控使用两台华为ne5000e作为地市的出口,承载整个地市的流量转发.3.BRAS设备 90%的设备使用的是华为ME60设备4.二层网络华为s9300系列交换机作为二层接入的汇聚设备.所有的olt设备下挂到93上,大大流量的业务olt,直接下挂bras设备上.所有二层设备二层隔离.5.路由协议分析1. 省网核心路由器与CMNET骨干网建立EBGP邻居关系.2.XS.ST核心出口路由器兼做BGP RR,地市核心分别与2台RR建立IBGP邻居.3.各地市

linux运维之分析系统负载及运行状况

1.删除0字节文件 find -type f -size 0 -exec rm -rf {} \; 2.查看进程 #按内存从大到小排列 ps -e -o "%C : %p : %z : %a"|sort -k5 -nr 3.按cpu利用率从大到小排列 ps -e -o "%C : %p : %z : %a"|sort -nr 4.打印出cache里的URL grep -r -a jpg /data/cache/* | strings | grep "htt

linux运维之分析日志相关命令(1)

一.分析日志 1.查看有多少IP访问 awk '{print $1}' log_file|sort|uniq|wc -l 2.查看某一个页面被访问的次数 grep "/index.php" log_file | wc -l 3.查看每一个IP访问了多少个页面 awk '{++S[$1]} END {for (a in S) print a,S[a]}' log_file > log.txt sort -n -t ' ' -k 2 log.txt #配合sort进一步排序 4.将每

机器学习常用算法盘点

在本文中,我将提供两种分类机器学习算法的方法.一是根据学习方式分类,二是根据类似的形式或功能分类.这两种方法都很有用,不过,本文将侧重后者,也就是根据类似的形式或功能分类.在阅读完本文以后,你将会对监督学习中最受欢迎的机器学习算法,以及它们彼此之间的关系有一个比较深刻的了解. 下面是一张算法思维导图,点击放大查看. 从学习方式分类 算法对一个问题建模的方式很多,可以基于经历.环境,或者任何我们称之为输入数据的东西.机器学习和人工智能的教科书通常会让你首先考虑算法能够采用什么方式学习.实际上,算法