1、安装
- 软件环境说明
win7 64位 + SAS9.4
- 准备工作
查看SAS的sid文件有效期,并修改系统时间为有效期之前的1个月,如图示:
- 修改sid
- 问题1:SAS EM创建项目报NO_FILE错误(报错时的场景是操作系统是中文,也没有修改系统时间)
解决方式:
1.操作系统语言改成英文版。(试过几次中文版的都失败了,不确定这是主因,因为安装成功时也修改了系统时间,之前失败的时候都没修改系统时间)
2.修改系统时间
2、创建Libraries及table
- 创建Libraries(软件重启后创建的Lib在窗口中会丢失,需要再创建并关联原存储目录)
- 创建table
3、Access数据导入(导入后的sas文件会很大,800M的accdb导成50G的sas表)
- 问题1:SAS导入access报Connect: Class not registered(因为SAS安装的是64位,office用的是32位导致的)
解决方式:
1.下载AccessDatabaseEngine_X64.exe文件
2.注册表删除32位access安装信息。执行cmd-->regedit,然后搜索“Access Connectivity Engine”并删除。
3.控制台cmd下执行下面命令(安装成功后电脑会立即自动重启):
"C:\directory path\AccessDatabaseEngine_x64.exe" /passive
如果上面命令依然不行,把exe文件解压后再执行下面命令:
"D:\BigData\SAS\安装文件\AccessDatabaseEngine_X64\AceRedist.msi" /passive
4.安装完成后,查看注册表HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office\14.0\Common\FilesPaths,删除mso.dll。否则每次都会出现Office Config的问题。
附:查看office2010是32位还是64位版本
4、ODBC数据导入
5、简单sql脚本,并点击Submit执行(执行时相关表不要打开,也不要被EM使用,否则可能报错或执行无效)
proc sql;
create table Hjhj.Aa as select * from Hjhj.Bb where loan < 4000;
delete from Hjhj.Aa where loan > 2000;
quit;
6、EM使用自定义Lib
7、run个小示例
- 创建Data Source
- 创建Diagram
- 定义流程(拖Data Source-->拖Data Partition(位于Sample Tab下)-->拖Decision Tree(位于Model Tab下)-->连线)
- 定义Data Source的target以及数据类型
- 定义Decision Tree参与分析的维度
- 选择Decision Tree并右键run后,查看结果
8、自定义配置
- run后的决策树可能被裁剪,可以尝试通过Interactive查看结果(可以修改根下面的维度字段,从而展现不同的树形结构)
- 默认只run一万条数据,点击Decision Tree后可以通过修改左侧属性default为User,以及Sample Size属性。
- 修改训练数据和验证数据的比率,点击Data Partition并修改属性值。
9、EM数据类型有五种
unary——只有唯一值型
binary——只有两个值型
nominal——两个以上的无序非数字值型
ordinal——多于两种情况的小于 10 的数值型
interval——大于 10 的数值型
如图所示