ch4-SPSS Statistics操作进阶

知识点:

单选题、多选题录入

分析前的数据清洗,包括删除重复记录、异常值、逻辑校验

总体和样本分布结构不一致的情况下的数据加权

相关问题分析时的交叉表

1、项目背景

2、问卷录入

单选题的定义:

  当定义了变量的值,如:1=“男”,2=“女”,在录入时可以通过“显示指标签”图标来通过下拉框选择的方法“选择男或女”来录入。

多选题的定义:

  首先确定使用二分法或多重分类法录入;

  其次,定义多选项变量集有2种方法,一是在“多重响应”子菜单下,一是在“表”子菜单下。前者属于base模块,相应的设定不能保存,不能在制表模块使用,后者属于table模块,且可保存在数据文件中重复使用,可用于所有制表过程。

下面是使用第二种方法:

3、问卷质量校验

去除重复记录:

  步骤一:找出重复记录,步骤二:对重复记录进行处理。

步骤一:

步骤二:

发现异常值:

  对于每个变量都有一定的取值范围,由于输入错误带来的异常值要在分析前进行处理。

  通过观察该变量的频率分布(分析-描述统计-频率)来识别异常值,通过“选择个案”来删除异常值。

逻辑校验:

  如:个人收入大于家庭收入;未婚但有小孩等有违逻辑常识的。

  步骤一:通过制表方式查看是否存在逻辑问题(分析-表-设定表格)

  步骤二:对有违逻辑的个案进行处理。删除的话在“数据-选择个案”中处理。

步骤一:

4、问卷数据分析

问卷加权:

  什么时候需要加权:样本的分布结构与总体结构不一致。如:总体男女比例为6:4,但样本问卷的男女比例为:7:3,此时需要对问卷数据赋予一定权重。

  加权思路:确定对结果有影响的变量-计算在该变量下的样本数量占比及权重-依据权重调整个案

步骤一:按需加权的变量进分类汇总,并保存为新文件。

步骤二:在新文件下,先计算总样本数,然后计算各类别的占比。即:各类别数/总样本数。

数据-分类汇总

转换-计算变量

步骤三:手工录入总体占比,即:总体下的性别分布和教育水平分布。然后计算权重=总体占比/类别占比。

计算权重在“转换-计算变量”中进行。

步骤四:将该权重合并到问卷数据中。在此之前需要对问卷数据按这两个变量进行排序。

排序:

文件合并:

步骤五:添加了权重变量后的问卷数据,要依据此权重进行数据加权。

加权后的数据会在“数据视图”右下角有“加权范围”字样。

业务分析:

  做各种交叉表进行业务分析,比如分析支付方式在性别上的分布,及性别对支付方式的影响。

  对单变量做频率分布,对相关变量做交叉表。

分析-表-设定表

时间: 2024-11-03 03:35:11

ch4-SPSS Statistics操作进阶的相关文章

IBM SPSS Statistics多变量预测建模

1. 应用背景 1.1 解决的问题 1)大型企业的 IT 系统对每一次应用程序的升级都会预先在其测试环境上进行测试.如何保证测试的有效性?如何通过测试的结果推测其在生产环境上的表现? 2)随着资源使用的增长,CPU.内存.硬盘.I/O 等资源互相影响并存在潜在关联.如何洞察其关联来指导企业做出合理的容量规划? 3)伴随业务扩展,企业生产环境的负载日益增加. 如何帮助企业通过对未来业务量和用户量的增长预测而做出相应的容量预估? 4)如何提供自动化.自适应的建模过程与预测分析,为企业用户打造针对个性

spss statistics 19.0配置odbc连接远程oracle数据库

本文档讲的是spss statistics 19.0如何配置odbc连接本地oracle数据库,步骤如下: 1.开启远程oracle数据库服务,开启以下两个即可 2.在本地客户端中,安装好oracle数据库(版本为win32_11gr2_client,主要是为了安装oracle的odbc驱动),通过PL/SQL客户端远程连接数据库,测试是否正常. 在D:\app\Administrator\product\11.1.0\client_1\network\admin目录中,新建tnsnames.o

在 SPSS Statistics 和 Modeler 中调用 R 语言的实现和应用

http://www.ibm.com/developerworks/cn/data/library/ba/ba-1401spss-r/index.html 登录 | 注册   IBM 技术主题 软件下载 社区 技术讲座 搜索 developerWorks 打印本页面 用电子邮件发送本页面 新浪微博 人人网 腾讯微博 搜狐微博 网易微博 Digg Facebook Twitter Delicious Linked In developerWorks 中国 技术主题 Information Mana

数据分析软件及spss简单操作

数据分析软件介绍 SPSS统计软件      SPSS是英文Statistical package for the social science 的缩写,翻译成汉语是社会学统计程序包,20世纪60年代末由美国斯坦福大学的三位研究生研制,1975年在芝加哥组建SPSS总部.SPSS系统特点是操作比较方便,统计方法比较齐全,绘制图形.表格较有方便,输出结果比较直观.SPSS是用FORTRAN语言编写而成.适合进行从事社会学调查中的数据分析处理.最新版为13.0版.网址:http://www.spss

作业一:数据软件系统的介绍及spss的操作简介

数据分析软件介绍 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.这一过程也是质量管理体系的支持过程.在实用中,数据分析可帮助人们作出判断,以便采取适当行动. 数据分析的数学基础在20世纪早期就已确立,但直到计算机的出现才使得实际操作成为可能,并使得数据分析得以推广.数据分析是数学与计算机科学相结合的产物. 在统计学领域,有些人将数据分析划分为描述性统计分析.探索性数据分析以及验证性数据分析:其中,探索性数据分析侧重于在数据

面向对象操作进阶

__setitem__ __getitem__ __delitem__把对象操作属性模拟成字典的格式: class Foo: def __init__(self,name): self.name=name def __getitem__(self, item): print(self.__dict__[item]) def __setitem__(self, key, value): self.__dict__[key]=value def __delitem__(self, key): pri

Selenium2(WebDriver)总结(五)---元素操作进阶(常用类)

1.Alert类 Alert是指windows弹窗的一些操作,需要new一个Alert类 driver.switchTo().alert():切换到alert窗口 alert.getText():取得弹窗上面的字符串 alert.accept():点击确定/ok类的按钮,使弹窗消失 alert.dismiss():取消 public void testAlert(){ WebElement element = driver.findElement(By.className("alert"

lucene 3.0.2 操作进阶

转自:Bannings http://blog.csdn.net/zhangao0086/article/details/6292950 Analyzer(分词器) 分词器能以某种规则对关键字进行分词,将分好的词放到目录中,以作为检索到的条件,在创建索引时会使用到分词器,在搜索时也将用到分词器,这两个地方要使用同一个分词器,否则可能找不到结果.分词器一般的工作流程: 切分关键词 去除停用词 对于英文单词,把所有字母转为小写 注:有的分词器对英文支持的非常好,还能对英文单词进行时态还原. 停用词的

项目实战12.2—企业级监控工具应用实战-zabbix操作进阶

无监控,不运维.好了,废话不多说,下面都是干货. 流量党勿入,图片太多!!! 项目实战系列,总架构图 http://www.cnblogs.com/along21/p/8000812.html 一.User parameters 用户参数 1.介绍和用法 ① 介绍 自定义用户参数,也就是自定义key 有时,你可能想要运行一个代理检查,而不是Zabbix的预定义 你可以编写一个命令来检索需要的数据,并将其包含在代理配置文件("UserParameter"配置参数)的用户参数中 ② 用法格