SPSS数据分析—卡方检验

t检验和方差分析主要针对于连续变量,秩和检验主要针对有序分类变量,而卡方检验主要针对无序分类变量(也可以用于连续变量,但需要做离散化处理),用途同样非常广泛,基于卡方统计量也衍生出来很多统计方法。

卡方统计量是基于卡方分布的一种检验方法,根据频数值来构造统计量,是一种非参数检验方法。SPSS中在交叉表和非参数检验中,都可调用卡方检验。

卡方检验的主要有两类应用

一、拟合度检验

1.检验单个无序分类变量各分类的实际观察次数和理论次数是否一致

此类问题为单变量检验,首先要明确理论次数,这个理论次数是根据专业或经验已知的,原假设为观察次数与理论次数一致

【例】:随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人, 问对分科的意见是否有显著的差异。

分析:如果意见没有差异,那么赞成反对的人数应该各半,即30次,因此理论次数为30

【例】:一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1

本例中检验的理论次数就不是各半了,而是有一定的比例1:1:2:2:1:1:1

2.检验某分类变量各类别出现的概率是否相等 此类问题也属于单变量检验,例如掷硬币正反面出现的概率均为1/2,骰子每面出现的概率为1/6,原假设为变量各类别出现的概率相等

【例】:一个骰子投掷120次,记录掷得每个点数的次数,问该骰子是否存在问题 如果骰子是正常的,那么每个点数掷得的概率应该相等,操作方法和前面一样,也使用非参数检验过程,选择默认的所有类别相等

实际上,上面的第一个例子碰巧可以和本例互相转化,意见没有差异等同于赞成和反对出现的概率相等,而每个骰子点数出现的理论次数为120*1/6=20次

3.检验某连续变量分布是否和某种理论分布一致

卡方检验主要用于分类变量,但是也可以用于对连续变量的拟合度检验上,此类问题的基本思想是:将总体X的取值范围分成k个互不重叠的小区间A1...A2...Ak,把落入第i个小区间的样本值个数作为实际频数,所有实际频数之和等于样本容量,根据理论分布,可以算出总体X的值落入每个小区间Ai的概率Pi,于是nPi就是落入Ai的样本值的理论频数。有了实际频数和理论频数,就可以计算卡方统计量并进行卡方检验了。

二、独立性检验

独立性检验分析两变量之间是否相互独立,或者控制某种因素之后,两变量之间是否相互独立。原假设为两变量相互独立或两变量间的相互作用没有差别。

对于两变量一般采用列联表的形式记录观察数据,分为四格表和R*C列联表,根据卡方统计量和分类变量的类型,又衍生出一些相关系数,这在相关分析中已经讲过。

【例】:为了解男女在公共场所禁烟上的态度,随机调查100名男性和80名女性。男性中有 58人赞成禁烟,42人不赞成;而女性中则有61人赞成,19人不赞成。分析男女在公共场所禁烟的问题所持态度不同? 或者说禁烟态度是否随性别变化而变化

两变量之间的独立性,是指一个变量不随另一个变量的变化而变化,该问题的一种分析角度是分析男女在公共场所禁烟的问题所持态度不同,这看似和拟合性类似,但是其中涉及两个变量——性别和态度,因此属于独立性检验。

从表面上看,拟合性检验和独立性检验不论在列联表的形式上,还是在计算卡方的公式上都是相同的,所以经常被笼统地称为卡方检验。但是两者还是存在差异的。

首先,两种检验抽取样本的方法不同。如果抽样是在各类别中分别进行,依照各类别分别计算其比例,属于拟合优度检验。如果抽样时并未事先分类,抽样后根据研究内容,把入选单位按两类变量进行分类,形成列联表,则是独立性检验。

其次,两种检验假设的内容有所差异。拟合优度检验的原假设通常是假设各类别总体比例等于某个期望概率,而独立性检验中原假设则假设两个变量之间独立。

最后,期望频数的计算不同。拟合优度检验是利用原假设中的期望概率,用观察频数乘以期望概率,直接得到期望频数。独立性检验中两个水平的联合概率是两个单独概率的乘积

时间: 2024-08-27 04:21:01

SPSS数据分析—卡方检验的相关文章

快速掌握SPSS数据分析

SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢?本文章将周老师(统计学专家)8年的数据分析经验浓缩,便于让不会数据分析的同学,在学习数据分析的过程中可以少走弯路,树立数据分析价值观,以及以数据进行决策的思维意识,并且可以快速的掌握数据分析.本文章分为四个板块进行说明,一是数据分析思维的培养.二是数据间的几类关系情况.三是数据分析方法的选择.四是数据

SPSS数据分析—对应分析

卡方检验只能对两个分类变量之间是否存在联系进行检验,如果分类变量有多个水平的话,则无法衡量每个水平间的联系.对此,虽然可以使用逻辑回归进行建模,但是如果分类变量的水平非常多,就需要分别设定哑变量,这样对于操作和解释都非常繁琐.而对应分析则是专门解决上述问题的方法,它特别擅长对两个分类变量的多个水平之间的对应性进行分析.常用于市场细分.产品定位.品牌形象及满意度研究. 对应分析最大的特点是通过直观的图形方式,展现分类变量不同水平之间的联系,水平越多,效果越好. 对应分析是一种多元统计分析方法,由于

SPSS数据分析—相关分析

相关系数是衡量变量之间相关程度的度量,也是很多分析的中的当中环节,SPSS做相关分析比较简单,主要是区别如何使用这些相关系数,如果不想定量的分析相关性的话,直接观察散点图也可以. 相关系数有一些需要注意的地方: 1.两变量之间存在相关,仅意味着存在关联,并不意味着因果关系.2.相关系数不能进行加减乘除运算,没有单位,不同的相关系数不可比较3.相关系数大小容易受到数据取值区间大小和数据个数大小的影响.4.相关系数也需要进行检验确定其是否有统计学意义 相关系数的假设检验中H0:相关系数=0,变量间没

SPSS数据分析—多维尺度分析

在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型).多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性.探索性数据分析方法. 基于以上,我们可以得知,多维尺度分析经常使

SPSS数据分析—配对Logistic回归模型

Lofistic回归模型也可以用于配对资料,但是其分析方法和操作方法均与之前介绍的不同,具体表现 在以下几个方面1.每个配对组共有同一个回归参数,也就是说协变量在不同配对组中的作用相同2.常数项随着配对组变化而变化,反映了非实验因素在配对组中的作用,但是我们并不关心其大小, 因此在拟合时采用条件似然函数代替了一般似然函数,从而在拟合中消去了反映层因素的参数. SPSS中没有直接拟合配对Logistic回归模型的过程,需要对数据进行一些处理,采用其他方法进行拟合,拟合方法有变量差值拟合和COX模型

SPSS数据分析—判别分析

判别分析作为一种多元分析技术应用相当广泛,和其他多元分析技术不同,判别分析并没有将降维作为主要任务,而是通过建立判别函数来概括各维度之间的差异,并且根据这个判别函数,将新加入的未知类别的样本进行归类,从这个角度讲,判别分析是从另一个角度对数据进行归类. 判别分析由于要建立判别函数,因此和回归分析类似,也有因变量和自变量,并且因变量应为分类变量,这样才能够最终将数据进行归类,而自变量可以是任意尺度变量,分类变量需要设置为哑变量. 既然和回归分析类似,那么判断分析也有一定的适用条件,这些适用条件也和

SPSS数据分析—主成分分析

我们在分析问题的时候,为了准确全面的反映问题,常常收集很多变量,这些变量之间往往具有相关性,导致存在大量的重复信息,直接使用的话,不但模型非常复杂,而且所引起的共线性问题会使模型准确度降低. 对此,我们经常使用主成分分析对数据进行处理,主成分分析是考察多变量间相关性的一种多元统计分析方法,基本思想是:既然变量很多并且之间存在相关性,那么我们就将其压缩合并,通过统计分析方法将多个变量结合成少数几个有代表性的主成分,这些主成分携带了原始变量的绝大部分信息,并且之间互不相关. 有时,我们提取主成分并不

SPSS数据分析—信度分析

测量最常用的是使用问卷调查.信度分析主要就是分析问卷测量结果的稳定性,如果多次重复测量的结果都很接近,就可以认为测量的信度是高的.与信度相对应的概念是效度,效度是指测量值和真实值的接近程度.二者的区别是:信度只是描述测量工具的准确性,而效度描述测量工具的有效性,效度高信度一定高(有效一定准确),而信度高,效度不一定高(准确不一定有效) 基于信度分析而产生的测量理论分为两种,一种是真分数测量理论,另一种是概化理论真分数理论认为信度可以用以下公式表达:X=T+E,X为实测分数,T为真分数,E为随机误

SPSS数据分析—最小一乘法

线性回归最常用的是以最小二乘法作为拟合方法,但是该方法比较容易受到强影响点的影响,因此我们在拟合线性回归模型时,也将强影响点作为要考虑的条件.对于强影响点,在无法更正或删除的情况下,需要改用更稳健的拟合方法,最小一乘法就是解决此类问题的方法. 最小二乘法由于采用的是残差平方和,而强影响点的残差通常会比较大,在平方之后会更大,而最小一乘法不使用平方和而采用绝对值之和,因此对于强影响点的残差来说,其影响会小很多. 我们通过一个例子来比较当强影响点出现时,最小二乘法和最小一乘法的拟合效果,在SPSS中