rank correlation

http://www.360doc.com/content/08/1228/23/50235_2219531.shtml

http://blog.csdn.net/lhkaikai/article/details/37352587

斯皮尔曼等级相关（Spearman’s correlation coefficient for ranked data）主要用于解决称名数据和顺序数据相关的问题。适用于两列变量，而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来，一些人把斯皮尔曼等级相关看做积差相关的特殊形式。

公式：

其中：di=xi-yi表示两个排序之间的差值；

n:表示样本的大小，即机器学习算法的数量；

解：此题被试5人，不知是否为正态分布，所以用斯皮尔曼等级相关解题。其中，x为听觉反应时间按大小排序，y为视觉反应时间按大小排序。d=x-y。

将n=5，∑d^2=6 带入公式 1-[6·∑(di)^2 / (n^3 - n)]

得：ρ=0.7

答：这5人的视听反应时等级相关系数为0.7，属于高度相关。

优点

适用范围广泛，斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格，只要两个变量的观测值是成对的等级评定资料，或者是由连续变量观测资料转化得到的等级资料，不论两个变量的总体分布形态、样本容量的大小如何，都可以用斯皮尔曼等级相关来进行研究。

缺点

一组能用积差相关计算的数据，如果改用等级相关，精确度会低于积差相关。凡符合积差相关条件的，最好不要用等级相关计算。

积差相关

积差相关又称积距相关，是当两个变量都是正态连续变量，两者之间呈线性关系时，表示这两个变量之间的相关
使用条件
积差相关的使用条件是：
1、两变量为连续变量，即变量数值取自等距或等比量表。
2、两变量呈线性关系，这可由相关的散布图的形状来描述。
3、两变量为正态分布，或接近正态分布，至少是单峰对称的分布。
4、必须是成对数据，每对数据之间相互独立。
5、要排除共同因素的影响。如果两个变量都随着一个共同因素在变化，即使算出的积差相关系数很高，也难以判断两个变量之间存在高度相关。
6、样本容量大于30，计算出的积差相关系数才有意义。

时间： 2024-10-02 18:23:49

rank correlation

优点

缺点

rank correlation的相关文章

Spearman's rank correlation coefficient 和 Pearson correlation coefficient详细

Learning to Rank 简介

[Statistics] Comparison of Three Correlation Coefficients: Pearson, Kendall, Spearman

特征工程(Feature Enginnering)学习记要

机器学习（十三）——机器学习中的矩阵方法（3）病态矩阵、协同过滤的ALS算法（1）

JavaScript 数据实用程序库：Datalib

Oracle 10gR2分析函数

【Matlab开发】matlab中bar绘图设置与各种距离度量

推荐系统中的相似度度量