针对客户需求,需要对一些数据做统计分析。统计分析的第一步,即为数据查询,查找出要统计分析的数据。
查询得出的是一个行列表格的结果集,行、列、表格等这些IT的数据库概念和Spss以及统计中的术语是如何对应的,这点是刚接触统计这方面的我首先要理清楚的。
变量(Variable)——结果集中的列。可以为数据库表字段,当然也可以使使用函数处理后的,即为表达式。
变量的类型分为字符型和数值型,有长度设置,对于数值有精度设置。
数值型,有数值和数值标签一说,例如性别,如果为字符型,则值为男或者女,如果为数值型,则值为1或者2,然后1、2为数值,对应的有男、女为数值标签。
案例(Case)——结果集中的行。一行记录为一个案例。
数据(Data)——结果集。
值(Value)——结果集中单元格的值,常量数据。
Spss作为一个统计分析工具,在IT人的眼中,关注的可能不是它能实现什么功能,而是它的输入和输出是什么。
Spss的输入,可以是它自定义的标准数据文件sav,也可以是数据库、Excel以及文本文件等,当然sav文件可以来自于Excel等。
而Spss的输出,包括统计分析的结果,例如图、表等,也包括命令日志、警告信息等。
spss C# 二次开发 学习笔记(二)——Spss以及统计术语解释(IT人眼中的统计术语)
时间: 2024-10-24 22:26:08