SPSS数据分析—两阶段最小二乘法

传统线性模型的假设之一是因变量之间相互独立,并且如果自变量之间不独立,会产生共线性,对于模型的精度也是会有影响的。虽然完全独立的两个变量是不存在的,但是我们在分析中也可以使用一些手段尽量减小这些问题产生的影响,例如采用随机抽样减小因变量间的相关性,使其满足假设;采用岭回归、逐步回归、主成分回归等解决共线性的问题。以上解决方法做都会损失数据信息,而且似乎都是采取一种回避问题的态度而非解决问题,当碰到更复杂的情况例如因变量和自变量相互影响时,单靠回避是无法得到正确的分析结果的,那么有没有更好的直接解决问题的方法呢?接下来介绍的

两阶段最小二乘法和路径分析就是解决此类问题比较好的方法。当因变量与自变量存在相互作用时,会直接违反传统回归模型的基本假设,也就无法再使用普通最小
二乘法,解决此类问题的方法是:首先确定和因变量有相互作用的自变量,将这些自变量作为因变量拟合回归方程,该方程中的自变量和原始因变量无关,用这些自变量的估计值代替原值进行分析,由于估计值是根据与原始因变量无关的变量预测而来,因此可以认为这些估计值也和因变量的作用是单向的,从而避免了相互作用的影响,整个过程用了两次最小二乘法,因此成为两阶段最小二乘法。当然,还有三阶或多阶最小二乘法。

两阶段最小二乘法在SPSS中有一个单独的过程:

分析—回归—两阶段最小二乘法

我们通过一个例子来说明其用法

现在想研究受教育年限、种族、年龄对收入的影响,表面上看,可以采用以教育年限、种族、年龄为自变量,收入为因变量的多重线性回归进行分析,但是根据常识,教育年限和收入存在双向的影响,这使得线性模型的基本假定被否定,分析结果可能不正确。此时,我们可以采用二阶段最小二乘法进行分析,为此,我们找到了父亲和母亲的受教育年限这两个变量,以此来估计原始变量的受教育年限,我们把这种在第一阶段用于预测自变量的变量称为工具变量,而被预测的自变量,称为内生变量。




时间: 2024-10-12 05:52:20

SPSS数据分析—两阶段最小二乘法的相关文章

SPSS数据分析—加权最小二乘法

标准的线性回归模型的假设之一是因变量方差齐性,即因变量或残差的方差不随自身预测值或其他自变量的值变化而变化.但是有时候,这种情况会被违反,称为异方差性,比如因变量为储蓄额,自变量为家庭收入,显然高收入家庭由于有更多的可支配收入,因此储蓄额差异较大,而低收入家庭由于没有过多的选择余地,因此储蓄会比较有计划和规律. 异方差性如果还是使用普通最小二乘法进行估计,那么会造成以下问题 1.估计量仍然具有无偏性,但是不具备有效性2.变量的显著性检验失去意义3.由于估计量变异程度增大,导致模型预测误差增大,精

快速掌握SPSS数据分析

SPSS难吗?无非就是数据类型的区别后,就能理解应该用什么样的分析方法,对应着分析方法无非是找一些参考资料进行即可.甚至在线网页SPSS软件直接可以将数据分析结果指标人工智能地分析出来,这有多难呢?本文章将周老师(统计学专家)8年的数据分析经验浓缩,便于让不会数据分析的同学,在学习数据分析的过程中可以少走弯路,树立数据分析价值观,以及以数据进行决策的思维意识,并且可以快速的掌握数据分析.本文章分为四个板块进行说明,一是数据分析思维的培养.二是数据间的几类关系情况.三是数据分析方法的选择.四是数据

MySQL源码之两阶段提交

在双1的情况下,两阶段提交的过程 环境准备:mysql 5.5.18, innodb 1.1 version配置: sync_binlog=1 innodb_flush_log_at_trx_commit=1 autocommit=0 设置断点: sql_parse.cc::dispatch_command --命令跳转入口 sql_parse.cc::mysql_parse sql_parse.cc::mysql_execute_command sql_parse.cc::trans_comm

关于分布式事务、两阶段提交、一阶段提交、Best Efforts 1PC模式和事务补偿机制的研究[转]

1.XA XA是由X/Open组织提出的分布式事务的规范.XA规范主要定义了(全局)事务管理器(Transaction Manager)和(局部)资源管理器(Resource Manager)之间的接口.XA接口是双向的系统接口,在事务管理器(Transaction Manager)以及一个或多个资源管理器(Resource Manager)之间形成通信桥梁.XA之所以需要引入事务管理器是因为,在分布式系统中,从理论上讲(参考Fischer等的论文),两台机器理论上无法达到一致的状态,需要引入一

MySQL binlog 组提交与 XA(两阶段提交)

1. XA-2PC (two phase commit, 两阶段提交 ) XA是由X/Open组织提出的分布式事务的规范(X代表transaction; A代表accordant?).XA规范主要定义了(全局)事务管理器(TM: Transaction Manager)和(局部)资源管理器(RM: Resource Manager)之间的接口.XA为了实现分布式事务,将事务的提交分成了两个阶段:也就是2PC (tow phase commit),XA协议就是通过将事务的提交分为两个阶段来实现分布

这篇文章关于两阶段提交和Paxos讲的很好

http://blog.chinaunix.net/uid-16723279-id-3803058.html <两阶段提交协议与paxos投票算法> 点评:2PC绝对是CP的死党,是分布式情况下强一致性算法,因此缺点也是很明显的, 单点coordinator是个严重问题: 没有热备机制,coordinator节点crash了或者连接它的网路坏了会阻塞该事务: 吞吐量不行,没有充分发动数量更多的participants的力量,一旦某个participant第一阶段投了赞成票就得在他上面加独占锁,

对分布式事务及两阶段提交、三阶段提交的理解

转载至:http://www.cnblogs.com/binyue/p/3678390.html,最近学习需要,先转载方便用用来强化加深印象 一.分布式数据一致性 在分布式系统中,为了保证数据的高可用,通常会将数据保留多个副本(replica),这些副本会放置在不同的物理的机器上. (1)什么是数据一致性 在数据有多份副本的情况下,如果网络.服务器或者软件出现故障,会导致部分副本写入成功,部分副本写入失败.这就造成各个副本之间的数据不一致,数据内容冲突. 造成事实上的数据不一致. (2)CAP定

[官方说明] 为什么ES4要分成两阶段?

从ES4第一个版本发布到现在,已经有段时间了,绝大多数坛友都已经适应了ES4所带来的新封装模式,但仍有部分新人和坛友对ES4的两阶段模式带有不解或曲解.本帖将就ES4的两阶段意义做出解释说明,希望更多朋友能体会ES4两阶段模式的设计目的. 1.什么是封装 讨论问题之前,我们先来简单说说什么是封装. 其实“封装”这个词翻译的太过抽象了,而原词汇“Sysprep”却是一个很具象化的词语,原意是“将系统(sys)准备好(prep)”,换句话说,就是将系统设定为可以部署(deploy)的状态. 封装本身

Atitit ACID解决方案2PC(两阶段提交)&#160;&#160;跨越多个数据库实例的ACID保证

Atitit ACID解决方案2PC(两阶段提交)  跨越多个数据库实例的ACID保证 1.1. ACID解决方案1 1.2. 数据库厂商在很久以前就认识到数据库分区的必要性,并引入了一种称为2PC(两阶段提交)的技术来提供跨越多个数据库实例的ACID保证.这个协议分为以下两个阶段:1 1.3. 基本上,数据库实现 ACID 最关键的技术是日志和锁.2 1.4. I- 实现事务隔离的主要手段是锁.另外一个关键技术是  MVCC (Multi-version Concurrency Control