MEANS过程
- MEAN过程默认输出的统计量有:观测总数、均值、标准差、最大值和最小值。如果要计算其他统计量或其中的某一些统计量,则可在PROC语句中指定统计量的关键字。
- BY语句规定了分组变量,要求在BY分组内计算描述性统计量 。
proc means data=data.bank min p1 q1 mean median q3 p99 max ; run;
UNIVARIATE过程
- UNIVARIATE过程也可以提供描述统计量的计算,另外还有统计频数、绘制图形和假设检验的功能。
- 使用UNIVARIATE过程计算描述统计量与MEANS过程所用的语句和选项都基本类似,只是UNIVARIATE过程不需要指定统计量关键字,而是默认给出所有的基本统计量和一些关于位置检验的结果。
proc univariate data=data.bank; run;
FREQ过程
- 描述分析,产生频数表和列联表,可以简单的描述数据
- 统计推断产生各种统计量,分析变量之间的关系
- TableS 用来定义频数表或交叉表,可以有多个tables语句。当频数表是命令为tables JOB1, 生成一维表;而命令为: tables JOB1*good_bad;变量之间中间用*隔开,表示生成二维交叉表
- Tables后的选项为norow nocol nopercent:若只需要频数,不需要各行各列的百分比,可在tables后面加上这些参数
proc freq data=data.bank; table poutcome*y/norow nocol nopercent; run;
- 对连续数值变量做Freq时,系统会对每个数值进行频数统计,这个结果一般不是我们所需要的。我们一般会将连续变量转换为离散变量,这个可以通过Format过程步来实现。
proc format; value age_cd 17-<25=‘<25‘ 25-<30=‘25-30‘ 30-<45=‘30-45‘ 45-<60=‘45-60‘ 60-high=‘>=60‘; run; proc freq data=data.bank; table y*age/norow nocol nopercent; format age age_cd.; run;
时间: 2024-11-19 10:38:18