(转)确定权重方法之一:主成分分析

转自:http://blog.sina.com.cn/s/blog_a032adb90101k47u.html

什么是权重呢?所谓权重,是指某指标在整体评价中的相对重要程度。权重越大则该指标的重要性越高,对整体的影响就越高。

权重要满足两个条件:每个指标的权重在0、1之间。所有指标的权重和为1。

权重的确定方法有很多,这里我们学习用主成分分析确定权重。

 一、主成分基本思想:

 图1 主成分基本思想的问与答

   

 二、利用主成分确定权重

如何利用主成分分析法确定指标权重呢?现举例说明。

假设我们对反映某卖场表现的4项指标(实体店、信誉、企业形象、服务)进行消费者满意度调研。调研采取4级量表,分值越大,满意度越高。现回收有效问卷2000份,并用SPSS录入了问卷数据。部分数据见下图(详细数据见我的微盘,下载地址为http://vdisk.weibo.com/s/yR83T)。

 图2 主成分确定权重示例数据(部分)

   

 1、操作步骤:

Step1:选择菜单:分析——降维——因子分析

 Step2将4项评价指标选入到变量框中

 Step3设置选项,具体设置如下:

 2、 输出结果分析

按照以上操作步骤,得到的主要输出结果为表1——表3,具体结果与分析如下:

 表1 KMO 和 Bartlett 的检验

表1是对本例是否适合于主成分分析的检验。KMO的检验标准见图3。

 图3 KMO检验标准

从图3可知,本例适合主成分分析的程度为‘一般’,基本可以用主成分分析求权重。

 表2 解释的总方差

从表2可知,前2个主成分对应的特征根>1,提取前2个主成分的累计方差贡献率达到94.513% ,超过80%。因此前2个主成分基本可以反映全部指标的信息,可以代替原来的4个指标(实体店、信誉、企业形象、服务)。

 表3 成份矩阵

从表3可知第一主成分与第二主成分对原来指标的载荷数。例如,第一主成分对实体店的载荷数为0.957。

   

 3确定权重

用主成分分析确定权重有:指标权重等于以主成分的方差贡献率为权重,对该指标在各主成分线性组合中的系数的加权平均的归一化

因此,要确定指标权重需要知道三点:

A 指标在各主成分线性组合中的系数

B 主成分的方差贡献率

C 指标权重的归一化

(1)指标在不同主成分线性组合中的系数

这个系数如何求呢?

用表3中的载荷数除以表2中第1列对应的特征根的开方。

例如,在第一主成分F1的线性组合中,实体店的系数=0.957/(2.775)1/2 ≈0.574。

按此方法,基于表2和表3的数据,在excel中可分别计算出各指标在两个主成分线性组合中的系数(见图4,其中SQRT表示开方)

 图4 各指标在两个主成分线性组合中的系数

由此得到的两个主成分线性组合如下:

F1=0.574χ1-0.019χ2+0.574χ3+0.583χ4        

F2=-0.048χ1+0.996χ2+0.010χ3+0.070χ4  

    

(2)主成分的方差贡献率

表2中“初始特征值”的“方差%”表示各主成分方差贡献率,方差贡献率越大则该主成分的重要性越强。

因此,方差贡献率可以看成是不同主成分的权重。

由于原有指标基本可以用前两个主成分代替,因此,指标系数可以看成是以这两个主成分方差贡献率为权重,对指标在这两个主成分线性组合中的系数做加权平均。

说得有些晦涩,我们来举个例子。按上述思路,实体店χ1这个指标的系数为:

这样,我们可以用excel计算出所有指标的系数(见图5)

 图5 所有指标在综合得分模型中的系数

由此得到综合得分模型为:

Y=0.409χ1+0.251χ2+0.424χ3+0.446χ4

(3)指标权重的归一化

由于所有指标的权重之和为1,因此指标权重需要在综合模型中指标系数的基础上归一化(见图6)

 图6 指标权重的确定

图6显示了我们基于主成分分析,最终所得到的指标权重。

用主成分分析来确定权重,你学会了吗?微盘里有数据,大家可以自己动手练一练:)

时间: 2024-10-08 22:30:55

(转)确定权重方法之一:主成分分析的相关文章

机器学习 —— 基础整理(四):特征提取之线性方法——主成分分析PCA、独立成分分析ICA、线性判别分析LDA

本文简单整理了以下内容: (一)维数灾难 (二)特征提取--线性方法 1. 主成分分析PCA 2. 独立成分分析ICA 3. 线性判别分析LDA (一)维数灾难(Curse of dimensionality) 维数灾难就是说当样本的维数增加时,若要保持与低维情形下相同的样本密度,所需要的样本数指数型增长.从下面的图可以直观体会一下.当维度很大样本数量少时,无法通过它们学习到有价值的知识:所以需要降维,一方面在损失的信息量可以接受的情况下获得数据的低维表示,增加样本的密度:另一方面也可以达到去噪

文本数据的机器学习自动分类方法(转)

http://blog.csdn.net/jdbc/article/details/50586042 本文为第一部分,着重介绍文本预处理以及特征抽取的方法. 随着互联网技术的迅速发展与普及,如何对浩如烟海的数据进行分类.组织和管理,已经成为一个具有重要用途的研究课题.而在这些数据中,文本数据又是数量最大的一类."文本分类是指在给定分类体系下,根据文本内容自动确定文本类别的过程"(达观数据科技联合创始人,张健).文本分类有着广泛的应用场景,例如: 新闻网站包含大量报道文章,基于文章内容,

浅析人脸检测之Haar分类器方法:Haar特征、积分图、 AdaBoost 、级联

浅析人脸检测之Haar分类器方法 一.Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来. 目前的人脸检测方法主要有两大类:基于知识和基于统计. Ø  基于知识的方法:主要利用先验知识将人脸看作器官特征的组合,根据眼睛.眉毛.嘴巴.鼻子等器官的特征以及相互之间的几何位置关系来检测人脸. Ø  基于统计的方法:将人脸看作一个整体的模式——二维像素矩

利用降维方法进行用户为基础的协同过滤优化

原文作者:新浪微博@王小科科科本文由36大数据翻译组-大海翻译,转载必须获得本站.原作者.译者的同意,拒绝任何不表明译者及来源的转载! 如何提高推荐算法的有效性?主要的方法是特征转化,模型选取,数据处理等等.降维是特征加工中的一个重要部分. 这篇博文主要讲述如何利用降维方法来提高以用户为基础的协同过滤方式,协同过滤依赖测量用户的相似性进行物品推荐.我会在接下来章节里阐述所用到的每一种方法. 1.基准值 这个数值的有效性来自R(均方根误差)的计算.我通过三种平均值计算方法设定系统基准值.第一,项目

主成分分析(Principal Component Analysis,PCA

主成分分析(Principal Component Analysis,PCA)是将多个变量通过线性变换以选出较少几个重要变量的多元统计分析方法. 原理:在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性.人们自然希望变量个数较少而得到的信息较多.在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠.主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量

数据分析方法汇总

一.描述统计 描述性统计是指运用制表和分类,图形以及计筠概括性数据来描述数据的集中趋势.离散趋势.偏度.峰度. 1.缺失值填充:常用方法:剔除法.均值法.最小邻居法.比率\回归法.决策树法. 2.正态性检验:很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验.常用方法:非参数检验的K-量检验.P-P图.Q-Q图.W检验.动差法. 二.假设检验 1.参数检验 参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值.百分数.方差.相关系数等)进行的

css权重计算方法浅谈

在这之前只知道css权重的皮毛,比如说:行内权重比头部权重高,头部比外部样式权重高----工作中才知道真正理解css权重重要性.理解权重了才能写出来最优css选择器来.对后面学习less,scss有很大帮助. 从css代码存放的位置来看,权重计算当然是--->内嵌样式 > 内部样式表 > 外联样式表!然而工作中我们的css代码都是写在外联样式表中的咯. 参考w3c样式选择器权重优先级是这个样子的 important > 内嵌样式 > ID > 类 > 标签 | 伪

主成分分析(PCA)原理及R语言实现

原理: 主成分分析 - stanford 主成分分析法 - 智库 主成分分析(Principal Component Analysis)原理 主成分分析及R语言案例 - 文库 主成分分析法的原理应用及计算步骤 - 文库 主成分分析之R篇 [机器学习算法实现]主成分分析(PCA)——基于python+numpy scikit-learn中PCA的使用方法 Python 主成分分析PCA 机器学习实战-PCA主成分分析.降维(好) 关于主成分分析的五个问题 主成分分析(PCA)原理详解(推荐) 多变

深度学习入门教程UFLDL学习实验笔记三:主成分分析PCA与白化whitening

主成分分析与白化是在做深度学习训练时最常见的两种预处理的方法,主成分分析是一种我们用的很多的降维的一种手段,通过PCA降维,我们能够有效的降低数据的维度,加快运算速度.而白化就是为了使得每个特征能有同样的方差,降低相邻像素的相关性. 主成分分析PCA PCA算法可以将输入向量转换为一个维数低很多的近似向量.我们在这里首先用2D的数据进行试验,其数据集可以在UFLDL网站的相应页面http://ufldl.stanford.edu/wiki/index.php/Exercise:PCA_in_2D