RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)

RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)

需要分析的文件:

右键分别创建读取excel数据,选择属性,设置对象,决策树算法这几个过程,然后连接起来

读取excel数据:【Insert Operator】—>【Import】—>【Data】—>【Read Excel】

选择属性:【Insert Operator】—>【Data Transformation】—>【Attribute Set Reduction and Transformation】—>【Selection】—>【Select Attributes】

设置对象:【Insert Operator】—>【Data Transformation】—>【Name and Role Modification】—>【Set Role】

决策树算法:【Insert Operator】—>【Modeling】—>【Classification and Regression】—>【Tree Induction】—>【Decision Tree】

点击【Read Excel】过程,右边出现

点击【Import Configuration Wizard】

全灰色表示全部选中,点击【Next】

第一栏的Name表示第一栏不是数据,如果不填就表示第一栏是跟下面的数据类型一样的,【Next】

体重变化只有两个值,选择【binominal】。点击【Finish】

点击【Select Attributes】过程中的【attribute filter type】选择【all】,对所有列进行分析

点击【Set Role】过程中的【attribute name】中的【体重变化】,【target role】中的【label】,以体重变化为主要研究对象

决策树算法按默认,

点击运行

生成决策树

1.Tree2.指标1 > 5.8833.|   指标2 > 9.843: 负 {负=2, 正=0}4.|   指标2 ≤ 9.8435.|   |   指标3 > 9.868: 负 {负=2, 正=1}6.|   |   指标3 ≤ 9.8687.|   |   |   指标2 > 8.6458.|   |   |   |   指标3 > 6.614: 负 {负=7, 正=0}9.|   |   |   |   指标3 ≤ 6.61410.|   |   |   |   |   指标1 > 6.736: 正 {负=0, 正=11}11.|   |   |   |   |   指标1 ≤ 6.736: 负 {负=1, 正=1}12.|   |   |   指标2 ≤ 8.645: 正 {负=8, 正=182}13.指标1 ≤ 5.88314.|   指标3 > 0.02715.|   |   指标3 > 0.23416.|   |   |   指标2 > 5.642: 负 {负=110, 正=0}17.|   |   |   指标2 ≤ 5.64218.|   |   |   |   指标1 > 3.07919.|   |   |   |   |   指标3 > 8.448: 负 {负=11, 正=0}20.|   |   |   |   |   指标3 ≤ 8.44821.|   |   |   |   |   |   指标5 > 0.37022.|   |   |   |   |   |   |   指标3 > 3.32023.|   |   |   |   |   |   |   |   指标4 > 0.55924.|   |   |   |   |   |   |   |   |   指标1 > 3.36925.|   |   |   |   |   |   |   |   |   |   指标3 > 5.87126.|   |   |   |   |   |   |   |   |   |   |   指标2 > 1.88927.|   |   |   |   |   |   |   |   |   |   |   |   指标1 > 5.517: 正 {负=0, 正=2}28.|   |   |   |   |   |   |   |   |   |   |   |   指标1 ≤ 5.51729.|   |   |   |   |   |   |   |   |   |   |   |   |   指标5 > 8.864: 正 {负=0, 正=2}30.|   |   |   |   |   |   |   |   |   |   |   |   |   指标5 ≤ 8.864: 负 {负=12, 正=0}31.|   |   |   |   |   |   |   |   |   |   |   指标2 ≤ 1.889: 正 {负=0, 正=6}32.|   |   |   |   |   |   |   |   |   |   指标3 ≤ 5.871: 正 {负=0, 正=15}33.|   |   |   |   |   |   |   |   |   指标1 ≤ 3.369: 负 {负=3, 正=0}34.|   |   |   |   |   |   |   |   指标4 ≤ 0.559: 负 {负=4, 正=0}35.|   |   |   |   |   |   |   指标3 ≤ 3.320: 正 {负=0, 正=24}36.|   |   |   |   |   |   指标5 ≤ 0.370: 负 {负=2, 正=0}37.|   |   |   |   指标1 ≤ 3.07938.|   |   |   |   |   指标2 > 0.26839.|   |   |   |   |   |   指标3 > 1.365: 负 {正=1, 负=64}40.|   |   |   |   |   |   指标3 ≤ 1.36541.|   |   |   |   |   |   |   指标2 > 1.97742.|   |   |   |   |   |   |   |   指标1 > 1.829: 正 {负=1, 正=3}43.|   |   |   |   |   |   |   |   指标1 ≤ 1.829: 负 {负=7, 正=0}44.|   |   |   |   |   |   |   指标2 ≤ 1.977: 正 {负=0, 正=2}45.|   |   |   |   |   指标2 ≤ 0.26846.|   |   |   |   |   |   指标1 > 1.251: 正 {负=0, 正=3}47.|   |   |   |   |   |   指标1 ≤ 1.251: 负 {负=2, 正=0}48.|   |   指标3 ≤ 0.23449.|   |   |   指标1 > 2.099: 正 {负=0, 正=7}50.|   |   |   指标1 ≤ 2.099: 负 {负=2, 正=0}51.|   指标3 ≤ 0.027: 正 {负=0, 正=2}

另外,对表数据读取过程右击,选择【Show ExampleSet Result】

可进行数据统计分析

时间: 2024-10-10 17:18:43

RapidMiner的基本使用(一个医疗数据的简单决策树算法分析)的相关文章

大数据架构和模式(二)——如何知道一个大数据解决方案是否适合您的组织

简介 在确定投资大数据解决方案之前,评估可用于分析的数据:通过分析这些数据而获得的洞察:以及可用于定义.设计.创建和部署大数据平台的资源.询问正确的问题是一个不错的起点.使用本文中的问题将指导您完成调查.答案将揭示该数据和您尝试解决的问题的更多特征. 尽管组织一般情况对需要分析的数据类型有一些模糊的理解,但具体的细节很可能并不清晰.毕竟,数据可能具有之前未发现的模式的关键,一旦识别了一种模式,对额外分析的需求就会变得很明显.要帮助揭示这些未知的未知信息,首先需要实现一些基本用例,在此过程中,可以

大数据架构和模式(二)如何知道一个大数据解决方案是否适合您的组织

本文收藏于http://kb.cnblogs.com/page/510979/ 作者: Divakar等  来源: DeveloperWorks  发布时间: 2015-01-29 18:20  阅读: 1542 次  推荐: 0   原文链接   [收藏] 摘要:本文介绍一种评估大数据解决方案的可行性的基于维度的方法.通过回答探索每个维度的问题,您可以通过自己对环境的了解来确定某个大数据解决方案对您是否适合.仔细考虑每个维度,就会发现有关是否到了改进您的大数据服务的时候的线索. 简介 在确定投

ViewPage+frament不预加载下一个Frament数据解决办法

在做一个ViewPage+Frament 滑动数效果,当滑动到每一页时加载哪一页的数据,但是ViewPage会预加载下一也数据,这个问题之前做项目是一直未解决,今天找到一个方法一下子就解决的这个问题,Frament里面有一个setUserVisibleHint方法,setUserVisibleHint每次fragment显示与隐藏都会调用,下面说一下这个方法的使用 @Override public void setUserVisibleHint(boolean isVisibleToUser)

【转载】串口中怎样接收一个完整数据包的解析

这里以串口作为传输媒介,介绍下怎样来发送接收一个完整的数据包.过程涉及到封包与解包.设计一个良好的包传输机制很有利于数据传输的稳定性以及正确性.串口只是一种传输媒介,这种包机制同时也可以用于SPI,I2C的总线下的数据传输.在单片机通信系统(多机通信以及PC与单片机通信)中,是很常见的问题. 一.根据帧头帧尾或者帧长检测一个数据帧 1.帧头+数据+校验+帧尾 这是一个典型的方案,但是对帧头与帧尾在设计的时候都要注意,也就是说帧头.帧尾不能在所传输的数据域中出现,一旦出现可能就被误判.如果用中断来

触发器记录表某一个字段数据变化的日志

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px "PingFang SC" } p.p3 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px Helvetica; min-height: 14.0px } span.s1 { font: 12.0px &qu

【C语言】请编写实现以下功能函数:实现对一个8bit数据(unsigned char)的指定位(例如第8位)的置0或置1操作,并保持其他位不变

/*请编写实现以下功能函数:实现对一个8bit数据(unsigned char)的指定位(例如第8位)的置0或置1操作,并保持其他位不变. 函数原型:void bit_set(unsigned char *p_date,unsigned char position,int flag). 函数参数说明:p_date是指定数据源,position是指定位(1~8),flag是置0或置1. */ #include <stdio.h> void bit_set(unsigned char *p_dat

oracle 的一个大数据表 快速迁移到 Sqlserver2008数据库

"-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> oracle 的一个大数据表 快速迁移到 Sqlserver2008数据库 - HappyBinhaer的专栏 - 博客频道 - CSDN.NET HappyBinhaer的专栏 目录视图 摘要视图 订阅 [活动]2017 CSDN博客专栏评选 &nbsp [5月书讯

使用SQL-Server创建一个银行数据管理系统Ⅰ

使用SQL-Server创建一个银行数据管理系统Ⅰ 作者声明: 刚开始写博客,难免有些不足的地方,再就是本人初涉软件开发这一行业,是个不折不扣的小白,文章中肯定也会出现一些错误的地方,希望发现错误的朋友们可以及时的指出来,不足的地方还请各路大神们多多指教,以便本人参考和学习,多谢. 首先,要创建一个完整的数据管理系统,不是一蹴而就的,一定要要一步一步的来,不断完善,最终方能达到自己想要的结果,所以兔子在这里也是一点一点分步来做的. 创建数据库,数据库属性在这里用的是默认(不推荐使用这种偷懒的做法

【c语言】实现对一个8bit数据(unsigned char 类型)的指定位(例如第n位)置0或者置1操作,并保持其他位不变

// 实现对一个8bit数据(unsigned char 类型)的指定位(例如第n位)置0或者置1操作,并保持其他位不变 #include <stdio.h> void bit_set(unsigned char *p_data, unsigned char position, int flag) { unsigned c; unsigned char a = 1; a = a << (position - 1); if (flag == 1) { *p_data = *p_dat