SPSS数据分析—最优尺度回归

在之前介绍的线性回归模型中,有一个隐含的假设是自变量均为连续变量,但实际上自变量有时候是分类变量,类似于方差分析中的因素,这种分类自变量在回归分析中,也默认作为连续变量使用,这就会产生一个问题,如果是无序分类变量,那么各类别间没有高低之分,每变化一个单位,对于因变量的影响是相同的,无法分析当中的趋势,虽然可以使用哑变量,但是当分类变量过多或每个变量的类别水平过多时,这种方法非常繁琐,此外,当类别较多时,可能会存在某几个类别对因变量的作用相似,这是可分析的点,但是传统线性模型却将此信息忽略,造成信息浪费。如果是有序分类变量,那么变量编码代表变量的高低顺序,这对于因变量的影响是不同的,而传统线性模型仍然忽略此信息,有可能会导致错误的分析结论。

基于以上问题,统计学家研究出了最优尺度变换这一方法,专门用于解决建模时如何对分类变量进行量化的问题。基本思想是基于希望拟合的模型框架,在保证各自变量间的联系为线性的前提下,通过一定的方法进行反复迭代,为原始分类变量找到一个最佳的量化评分,用这个评分代替原始变量进行后续的分析,这样一来,不仅仅是回归分析,任何包含分类自变量的分析方法都将适用于此,大大扩展了分析方法的适用范围。

最优尺度变换用于回归分析中,就是最优尺度回归,具体过程为

分析—回归—最佳尺度

本例中,我们想分析年龄、居住地、受教育程度对于子女数的影响,这里面年龄为连续变量,居住地为两分类变量、受教育程度为有序分类变量,从数据情况来看,自变量类型比较杂,年龄和居住地可以直接纳入模型分析,受教育程度可以设置哑变量形式引入模型,但是这样一来,相当于把该变量分散开,无法作为一个完整的变量进行分析了,在此,我们使用最优尺度回归。


以上结果都是将变量进行最优尺度变换之后的回归分析结果,那么如何查看变量的变换情况呢?该过程同时提供了转换图可供参考,点击绘制按钮设置即可


时间: 2024-08-06 20:07:00

SPSS数据分析—最优尺度回归的相关文章

SPSS数据分析—多维尺度分析

在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大.而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型).多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性.探索性数据分析方法. 基于以上,我们可以得知,多维尺度分析经常使

SPSS数据分析—多分类Logistic回归模型

前面我们说过二分类Logistic回归模型,但分类变量并不只是二分类一种,还有多分类,本次我们介绍当因变量为多分类时的Logistic回归模型. 多分类Logistic回归模型又分为有序多分类Logistic回归模型和无序多分类Logistic回归模型 一.有序多分类Logistic回归模型 有序多分类Logistic回归模型拟合的基本方法是拟合因变量水平数-1个Logistic回归模型,也称为累积多分类Logit模型,实际上就是将因变量依次分割成两个等级,对这两个等级建立二分类Logistic

SPSS数据分析—基于最优尺度变换的典型相关分析

传统的典型相关分析只能考虑变量之间的线性相关情况,且必须为连续变量,而我们依然可以使用最优尺度变换来拓展其应用范围,使其可以分析非线性相关.数据为分类数据等情况,并且不再仅限于两个变量间的分析, 虽然具体算法非常复杂,但是过程却只要两步,首先对变量进行最优尺度变换,然后对其进行典型相关分析. 我们还是以之前的多重对应分析的案例数据进行分析 过程还是在分析—降维—最佳尺度

SPSS数据分析—Probit回归模型

Probit含义为概率单位,和Logistic回归一样,Probit回归也用于因变量为分类变量的情况,通常情况下,两种回归方法的结果非常接近,但是由于Probit回归的结果解释起来比较抽象不易理解,因此应用不如Logistic回归那样广泛. Probit回归是基于正态分布理论上进行的,而Logistic回归是基于二项分布,这是二者的区别,当自变量中连续变量较多且符合正态分布时,可以考虑使用Probit回归,而自变量中分类变量较多时,可考虑使用Logistic回归. 在SPSS中,有两个过程可以进

快速掌握SPSS数据分析

SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢?本文章将周老师(统计学专家)8年的数据分析经验浓缩,便于让不会数据分析的同学,在学习数据分析的过程中可以少走弯路,树立数据分析价值观,以及以数据进行决策的思维意识,并且可以快速的掌握数据分析.本文章分为四个板块进行说明,一是数据分析思维的培养.二是数据间的几类关系情况.三是数据分析方法的选择.四是数据

SPSS数据分析—配对Logistic回归模型

Lofistic回归模型也可以用于配对资料,但是其分析方法和操作方法均与之前介绍的不同,具体表现 在以下几个方面1.每个配对组共有同一个回归参数,也就是说协变量在不同配对组中的作用相同2.常数项随着配对组变化而变化,反映了非实验因素在配对组中的作用,但是我们并不关心其大小, 因此在拟合时采用条件似然函数代替了一般似然函数,从而在拟合中消去了反映层因素的参数. SPSS中没有直接拟合配对Logistic回归模型的过程,需要对数据进行一些处理,采用其他方法进行拟合,拟合方法有变量差值拟合和COX模型

SPSS数据分析—分段回归

在SPSS非线性回归过程中,我们讲到了损失函数按钮可以自定义损失函数,但是还有一个约束按钮没有讲到,该按钮的功能是对自 定义的损失函数的参数设定条件,这些条件通常是由逻辑表达式组成,这就使得损失函数具有一定的判断能力. 该功能的主要作用是进行分段回归,有些时候,变量间的关系并非一成不变,而是具有某种阶段性特征,如果我们对每个阶段单独 进行拟合的话,会造成参数较多,无法从整体上把握问题实质,并且样本也被分割成多个,会影响精度,而使用非线性回归的定义 约束条件,就可以使用一个模型表达式拟合各个阶段,

SPSS数据分析—多重线性回归

只有一个自变量和因变量的线性回归称为简单线性回归,但是实际上,这样单纯的关系在现实世界中几乎不存在,万事万物都是互相联系的,一个问题的产生必定多种因素共同作用的结果. 对于有多个自变量和一个因变量的线性回归称为多重线性回归,有的资料上称为多元线性回归,但我认为多元的意思应该是真的因变量而非自变量的,而且多重共线性这个说法,也是针对多个自变量产生的,因此我还是赞同叫做多重线性回归. 多重线性回归是适用条件和简单线性回归类似,也是自变量与因变量之间存在线性关系.残差相互独立.残差方差齐性,残差呈正态

SPSS数据分析—判别分析

判别分析作为一种多元分析技术应用相当广泛,和其他多元分析技术不同,判别分析并没有将降维作为主要任务,而是通过建立判别函数来概括各维度之间的差异,并且根据这个判别函数,将新加入的未知类别的样本进行归类,从这个角度讲,判别分析是从另一个角度对数据进行归类. 判别分析由于要建立判别函数,因此和回归分析类似,也有因变量和自变量,并且因变量应为分类变量,这样才能够最终将数据进行归类,而自变量可以是任意尺度变量,分类变量需要设置为哑变量. 既然和回归分析类似,那么判断分析也有一定的适用条件,这些适用条件也和