sas相关限制及选项的含义

1:libref必须小于等于8个字符,以字母或下划线开始,只能包括字母,下划线和数字。

2:sas数据集的列名默认用变量的label,如果没有label就用变量名替代。

3:sas假定外部文件的record lenght只有256The record length is the number of characters, including spaces, in a data line.《一条观测的长度,包括一条观测值的所有变量以及空格的长度

use the LRECL= option in the INFILE statement to specify a record length

INFILE ’c:\MyRawData\President.dat’ LRECL=2000;

4:sas中input的变量名必须小于等于32个字节

5:SAS will go to the next data line to read more data if there are more variables in the INPUT statement than there are values in the data line.

6:sas只会读取字符型变量的8前八位,如果你需要读取更多,可以自己设定length选项或读取是用 :$20. 冒号是关键, :告诉sas要么把规定的长度读完,要么读到相应的分隔符就停止

7:sas有按列方式读取,有list方式读取数据,还有格式方式读取数据,$informatw. informatw.d informatw. 一般date用格式读取方式较多,三种格式可以混合使用。使用@n 可以将指针移动到到第n列读取数据,使用@‘char‘可以读取char后面的字符。

8:一条观测值读取多行数据

DATA highlow;
INPUT City $ State $ / NormalHigh NormalLow #3 RecordHigh RecordLow; */表示读取下一行 #n表示读取第n行;
    datalines;
        Nome AK
        55 44
        88 29
        Miami FL
        90 75
        97 65
        Raleigh NC
        88 68
        105 50
    ;
RUN; 

9:一行数据读取到多条观测值

DATA highlow;
INPUT City $ State $  NormalHigh NormalLow @@; *@@表示一条观测值读取完毕后不换行继续读取下一条观测值;
cards;
Nome AK 2.5 15 Miami FL 6.75
18 Raleigh NC . 12
;
RUN;

8:运动单@尾符读取部分数据

DATA highlow;
INPUT type $ @; *单@会一直保持一行读取,除非data步结束,或者另一个input语句不是以@结束;
IF type ne ‘surface‘ then delete;
INPUT Stree $ 9-38 maxV minV;
CARDS;
freeway 408                           3684 3459
surface Martin Luther King Jr. Blvd.  1590 1234
surface Broadway                      1259 1290
surface Rodeo Dr.                     1890 2067
freeway 608                           4583 3860
freeway 808                           2386 2518
surface Lake Shore Dr.                1590 1234
surface Pennsylvania Ave.             1259 1290
;
RUN;

9:You need the TRUNCOVER option when you are reading data using column or formatted input and some data lines are shorter than others

missover和truncover的区别,对于一行结束时有缺省,如果是按列方式读取,(就是规定了列的数量)missover会把最后一个变量也置为缺失,而truncover会把缺失部分截除掉。

图上面的数据集是truncover的结果

10:dsd和dlm的作用(重要)

dlm是dlimiter的意思,用来表示文件的分隔符,对于常用的csv文件用dlm=‘,‘;对用tab分隔符,如果电脑编码是ASCII则用dlm=‘09‘x;如果编码为EBCDIC则用dlm=‘05‘X;

dsd是Delimiter Sensitive data的意思,对于infile文件他有三个作用

1:忽视引号内的分隔符

2:当读取带引号的字符串时,不把引号内读作数据的一部分

3:将两个连续的分隔符当做缺失值处理

11:PROC IMPORT过程。

import过程会预先扫描20行来判断变量对应的类型,并且会根据你的文件后缀来判断你的分隔符,如果是.csv则会用‘,‘,.txt则用‘09‘X,其他的需要自己声明。

会忽略引号,并将两个连续分隔符当做缺失值处理。实现dsd dlm missover的大部分功能。

PROC IMPORT DATAFILE=‘D:\truncO.csv‘ OUT=Temp REPLACE;GETNAMES=NO;RUN;

REPLACE会将输出数据集替代原有的数据集。

GETNAMES=NO; 是不把第一行当做列名。

DATAROWS = n;是规定从第几行开始读取

GUESSINGROWS = n; 是改变默认扫面的行数

sas相关限制及选项的含义

时间: 2024-10-12 00:37:36

sas相关限制及选项的含义的相关文章

sas中一些小的选项的含义

确定文件中一行的长度. LRECL= specifies the physical line length of the file. LINESIZE= tells the INPUT statement how much of the line to read. DropOver以及不用此选项的默认执行的具体过程 By default, data that exceeds the current line length is written on a new line. When you sp

[linux内核]linux各个内核配置选项的含义以及配置

1,linux各个内核配置选项的含义 linux各个内核配置选项含义 2,make menuconfig命令的使用 Y表示加载,N表示不加载,M表示的是作为模块的方式载入内核. 3,以模块方式载入的时候如何动态加载 如何动态加载模块

centOS中网络配置相关文件配置选项说明

CentOS 修改IP地址等网络相关的配置文件 找到对应网卡的IP地址配置文件:ifcfg-eth数字.路径:/etc/sysconfig/network-scripts/ifcfg-eth数字文件内配置项说明 DEVICE=eth0 #描述网卡对应的设备别名,例如ifcfg-eth0的文件中它为eth0  BOOTPROTO=static #设置网卡获得ip地址的方式,选项有:static(静态),dhcp(通过DHCP获取IP)或bootp(使用BOOTP协议获得IP)  BROADCAST

SAS PROC PRINT 常用选项和语句说明

常用选项1.使用选项OBS=修改观测序号标签2.使用NOOBS选项不显示观测序号列3.使用ID语句在输出中取代观测序号列4.使用VAR选择输出的变量5.使用WHERE语句选择输出的观测6.使用数据集选项FIRSTOBS=和使用OBS=来控制观测输出的区间 制作增强型报表:1.使用SUM语句对变量进行求和2.使用SUM语句对变量进行分组汇总 改进报表显示:1.添加标题(TITLE)和脚注(FOOTNOTE)2.使用FORMAT语句规定输出格式3.使用LABEL语句规则输出变量的标签(需要在PROC

[DataSource] Properties 以及 DataSource 各个选项的含义:Data Connection,Directory,Excel,File,Grid,Groovy,JDBC,XML

http://www.soapui.org/about-soapui-pro/working-with-soapui-pro.html DataSource type dropdown – lets you pick which external source you would use to pull into your test case. Excel – Point to an Excel (xls) file JDBC – Connect to a database and pull d

TortoiseSVN里checkout depth各选项的含义

代表四种检出深度: 1.Fully recursive--全递归:检出完整的目录树,包含所有的文件或子目录.2.Immediate children,including folders--直接子节点,包含文件夹:检出目录,包含其中的文件或子目录,但是不递归展开子目录.3.Only file chlidren--仅文件子节点:检出指定目录,包含所有文件,但是不检出任何子目录.4.Only this item--仅此项:只检出目录.不包含其中的文件或子目录

ART运行时Java堆创建过程分析

与Dalvik虚拟机一样,ART运行时内部也有一个Java堆,用来分配Java对象.当这些Java对象不再被使用时,ART运行时需要回收它们占用的内存.在前面一文中,我们简要介绍了ART运行时的垃圾收集机制,从中了解到ART运行时内部使用的Java堆是由四种Space以及各种辅助数据结构共同描述的.为了后面可以更好地分析ART运行时的垃圾收集机制,本文就对它内部使用的Java堆的创建过程进行分析. 本博参加博客之星评选,求投票:点击投票 老罗的新浪微博:http://weibo.com/shen

LSI SAS 2208 配置操作

配置LSISAS2208 介绍LSISAS2208扣卡的配置方法. 2.1 登录CU界面 介绍登录LSISAS2208的CU配置界面的方法,以及CU界面的主要功能. 2.2 创建RAID 介绍创建RAID的操作方法. 2.3 配置RAID 介绍RAID扣卡的常用操作. 2.1  登录CU界面 介绍登录LSISAS2208的CU配置界面的方法,以及CU界面的主要功能. 操作场景 CU(Configuration Utility)配置工具(以下简称CU)用于配置及管理LSISAS2208控制器.CU

Java 6 JVM参数选项大全(中文版)

原文来自: http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm 本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Options 编写的译文.主要介绍JVM中的非稳态选项及其使用说明. 为了让读者明白每个选项的含义,作者在原文基础上补充了大量的资料.希望这份文档,对正在研究JVM参数的朋友有帮助! 非稳态选项使用说明 -XX:+<option> 启用选项 -XX:-<option> 不