RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)
需要分析的文件:
右键分别创建读取excel数据,选择属性,设置对象,决策树算法这几个过程,然后连接起来
读取excel数据:【Insert Operator】—>【Import】—>【Data】—>【Read Excel】
选择属性:【Insert Operator】—>【Data Transformation】—>【Attribute Set Reduction and Transformation】—>【Selection】—>【Select Attributes】
设置对象:【Insert Operator】—>【Data Transformation】—>【Name and Role Modification】—>【Set Role】
决策树算法:【Insert Operator】—>【Modeling】—>【Classification and Regression】—>【Tree Induction】—>【Decision Tree】
点击【Read Excel】过程,右边出现
点击【Import Configuration Wizard】
全灰色表示全部选中,点击【Next】
第一栏的Name表示第一栏不是数据,如果不填就表示第一栏是跟下面的数据类型一样的,【Next】
体重变化只有两个值,选择【binominal】。点击【Finish】
点击【Select Attributes】过程中的【attribute filter type】选择【all】,对所有列进行分析
点击【Set Role】过程中的【attribute name】中的【体重变化】,【target role】中的【label】,以体重变化为主要研究对象
决策树算法按默认,
点击运行
生成决策树
1.Tree2.指标1 > 5.8833.| 指标2 > 9.843: 负 {负=2, 正=0}4.| 指标2 ≤ 9.8435.| | 指标3 > 9.868: 负 {负=2, 正=1}6.| | 指标3 ≤ 9.8687.| | | 指标2 > 8.6458.| | | | 指标3 > 6.614: 负 {负=7, 正=0}9.| | | | 指标3 ≤ 6.61410.| | | | | 指标1 > 6.736: 正 {负=0, 正=11}11.| | | | | 指标1 ≤ 6.736: 负 {负=1, 正=1}12.| | | 指标2 ≤ 8.645: 正 {负=8, 正=182}13.指标1 ≤ 5.88314.| 指标3 > 0.02715.| | 指标3 > 0.23416.| | | 指标2 > 5.642: 负 {负=110, 正=0}17.| | | 指标2 ≤ 5.64218.| | | | 指标1 > 3.07919.| | | | | 指标3 > 8.448: 负 {负=11, 正=0}20.| | | | | 指标3 ≤ 8.44821.| | | | | | 指标5 > 0.37022.| | | | | | | 指标3 > 3.32023.| | | | | | | | 指标4 > 0.55924.| | | | | | | | | 指标1 > 3.36925.| | | | | | | | | | 指标3 > 5.87126.| | | | | | | | | | | 指标2 > 1.88927.| | | | | | | | | | | | 指标1 > 5.517: 正 {负=0, 正=2}28.| | | | | | | | | | | | 指标1 ≤ 5.51729.| | | | | | | | | | | | | 指标5 > 8.864: 正 {负=0, 正=2}30.| | | | | | | | | | | | | 指标5 ≤ 8.864: 负 {负=12, 正=0}31.| | | | | | | | | | | 指标2 ≤ 1.889: 正 {负=0, 正=6}32.| | | | | | | | | | 指标3 ≤ 5.871: 正 {负=0, 正=15}33.| | | | | | | | | 指标1 ≤ 3.369: 负 {负=3, 正=0}34.| | | | | | | | 指标4 ≤ 0.559: 负 {负=4, 正=0}35.| | | | | | | 指标3 ≤ 3.320: 正 {负=0, 正=24}36.| | | | | | 指标5 ≤ 0.370: 负 {负=2, 正=0}37.| | | | 指标1 ≤ 3.07938.| | | | | 指标2 > 0.26839.| | | | | | 指标3 > 1.365: 负 {正=1, 负=64}40.| | | | | | 指标3 ≤ 1.36541.| | | | | | | 指标2 > 1.97742.| | | | | | | | 指标1 > 1.829: 正 {负=1, 正=3}43.| | | | | | | | 指标1 ≤ 1.829: 负 {负=7, 正=0}44.| | | | | | | 指标2 ≤ 1.977: 正 {负=0, 正=2}45.| | | | | 指标2 ≤ 0.26846.| | | | | | 指标1 > 1.251: 正 {负=0, 正=3}47.| | | | | | 指标1 ≤ 1.251: 负 {负=2, 正=0}48.| | 指标3 ≤ 0.23449.| | | 指标1 > 2.099: 正 {负=0, 正=7}50.| | | 指标1 ≤ 2.099: 负 {负=2, 正=0}51.| 指标3 ≤ 0.027: 正 {负=0, 正=2}
另外,对表数据读取过程右击,选择【Show ExampleSet Result】
可进行数据统计分析