之前已经介绍过BASE SAS分为数据步和过程步,过程步是对数据步生成的数据集进行分析和处理,并挖掘数据信息,写出分析报告做总结评价。
1、语法格式:
proc 过程名④ <data=数据集名> <选项①>;/*后续会根据标注的序号说明解释*/
过程语句② ③<参数选项>;
run;
2、过程语句②:
- var :指定分析变量,多个变量以空格分隔
- by:指定一个或多个变量对数据集分组,数据集要先排序
- class:指定一个或多个分类变量,不需要事先对数据集排序
- model:建模中指定模型的因变量和自变量,model 因变量=自变量 /选项
- freq:指定用于分析变量的频数变量
- weight:指定权数变量,以获得该变量占百分比的权重
- id:指定观测标识,输出会去掉obs选项标识
- output:将过程分析结果输出到新数据集,output out=新数据集 <关键字=变量名>
- where:条件选项语句
- title:输出文件加标题信息
- footnote:输出文件加脚注信息
- options:改变系统默认设置
3、过程步中变量属性语句③:对变量的操作
- label:指定变量标签,解释变量含义,label 变量名1=’标签名1‘ 变量名2=’标签名2‘;
- format:指定变量输出格式
- attrib:定义变量属性
4、过程步选项参数①:过程步所调用的参数
- noobs:指定不输出obs标识
- firstobs:从数据第几条记录开始观测,firstobs=
- obs:指定到数据集的第几条记录结束,obs=
- double:指定观测记录之间加入一行间隔
5、常用过程部④:
- means过程:对数值变量进行简单描述统计,最小值、最大值、均值、标准差、方差等分析
- summary过程:对观测数据的变量或数据观测分组后的组内变量进行描述性统计分析
- univariate过程:除了具有means过程的统计信息外,还有对偏度、峰度、四分位和众数等的统计分析
- chart制图过程:绘制出变量值与统计相关的变量值之间的关系图
- tabulate制表过程:绘制表格
- print过程:打印输出信息
- corr相关过程:研究变量之间的相关程度
- reg过程:回归分析
时间: 2024-10-26 15:41:47