【weka应用技术与实践】过滤器

weka中的过滤器主要用于数据预处理阶段对数据集的各种操作。

今天简单地使用一下过滤器:

首先打开一个自带数据集weather.numeric.arff,这是一个关于通过天气条件,气温以及风力等因素来判断是否要play。可以看到:

看一下数据的大致情况:

红色代表no,蓝色代表yes。

问题一:假设我现在要添加一列新的属性叫“心情”,分类三类:好(good),不好(bad),一般(normal)。该怎么做?

方法:

1.AddUserFields过滤器:选择该过滤器:

new一个:

apply之后,可以看到:

这样,属性就已经添加完了。

2.AddValues过滤器:

属性有了,值还没有,所以选择AddValues过滤器:

输入之后,再去edit就可以选择了:

简单填写完毕之后,

3、Reorder过滤器:

因为weka默认最后一列属性是作为分类属性,因此,我们还得使用reorder分类器,把最后一列调整到前面去,还是把play作为分类列:

apply之后,可以看到列已经换了:

或者还有一种更快的方法:

时间: 2024-10-29 11:56:52

【weka应用技术与实践】过滤器的相关文章

推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》

该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,下载前两章请到:http://download.csdn.net/detail/u010968153/8686369 图书简介: 本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离.全书共分8章,主要内容包括Weka

数据挖掘与机器学习——weka应用技术与实践

第一章 weka介绍 1.1 weka简介 weka是怀卡托智分析环境(Waikato Environment for Knowledge Analysis)的英文缩写,官方网址为:<http://www.cs.waikato.ac.nz/ml/weka/>,在该网站可以免费下载可运行软件和代码,还可以获得说明文档.常见问题解答.数据集和其他文献等资源. 1.1.1 Weka的历史 团队宣称:我们的目标是要建立最先进的软件开发机器学习技术,并将其应用于解决现实世界的数据挖掘问题.目标:是机器学

《Spark大数据分析:核心概念、技术及实践》大数据技术一览

本节书摘来自华章出版社<Spark大数据分析:核心概念.技术及实践>一书中的第1章,第1节,作者穆罕默德·古勒(Mohammed Guller)更多章节内容可以访问云栖社区"华章计算机"公众号查看. 大数据技术一览 我们正处在大数据时代.数据不仅是任何组织的命脉,而且在指数级增长.今天所产生的数据比过去几年所产生的数据大好几个数量级.挑战在于如何从数据中获取商业价值.这就是大数据相关技术想要解决的问题.因此,大数据已成为过去几年最热门的技术趋势之一.一些非常活跃的开源项目都

《深度解析SDN——利益、战略、技术、实践》有奖互动

盛科张卫峰在书中使用通俗易懂的语言全面深入介绍了SDN,书籍自出版后便收获了一批忠实书迷.即日起至4月17日 ,一句话告诉SDNLAB为什么送你此书,转发微博(微博地址)并@3位好友,即有可能免费获赠该书一本. 内容提要 SDN是当前的热点技术,但是由于SDN技术相对还比较新,而且本身内涵并不清晰,所以极容易产生误解,不仅初学者不太容易把握,即便是已经接触过一段时间的人,也仍然会造成混淆.<深度解析SDN--利益.战略.技术.实践>用通俗易懂的语言深入浅出地介绍SDN的概念本质,SDN架构,产

《云计算架构技术与实践》之云接入的典型应用

桌面云的概念和价值 云接入的典型应用就是我们最常见到的桌面云. 什么是桌面云,桌面云的定义是:"可以通过瘦客户端或者其他任何与网络相连的设备来访问跨平台的应用程序以及整个客户桌面."也就是说我们只需要一个瘦客户端设备,或者其他任何可以连接网络的设备,通过专用程序或者浏览器,就可以访问驻留在服务器端的个人桌面以及各种应用,并且用户体验和我们使用传统的个人电脑是一模一 样的. 桌面云的业务价值很多,除了上面提到的随时随地访问桌面以外,还有下面一些重要的业务价值. 集中化管理 在使用传统桌面

量化投资:数据挖掘技术与实践(MATLAB版)——互动出版网

这篇是计算机类的优质推荐>>>><量化投资:数据挖掘技术与实践(MATLAB版)> 编辑推荐 本书的读者对象为从事投资.数据挖掘.数据分析.数据管理工作的专业人士:金融.经济.管理.统计等专业的教师和学生:希望学习MATLAB的广大科研人员.学者和工程技术人员. 内容简介 全书内容分为三篇.第一篇(基础篇)主要介绍数据挖掘与量化投资的关系,以及数据挖掘的概念.实现过程.主要内容.主要工具等内容.第二篇(技术篇)系统介绍了数据挖掘的相关技术及这些技术在量化投资中的应用,主

构建大型云计算平台分布式技术的实践

作者 章文嵩 发布于 2014年7月23日 | 本文基于章文嵩博士在2014年7月18日的全球架构师峰会ArchSummit上的主题演讲<构建大型云计算平台分布式技术的实践>整理而成. 演讲者简介 章文嵩博士是阿里集团的高级研究员与副总裁,主要负责基础核心软件研发和云计算产品研发.推进网络软硬件方面的性能优化.搭建下一代高可扩展低碳低成本电子商务基础设施.他也是开放源码及Linux内核的开发者,著名的Linux集群项目LVS(Linux Virtual Server)的创始人和主要开发人员.L

2017-2018-2 20179205《网络攻防技术与实践》第九周作业

<网络攻防技术与实践>第九周作业 视频学习总结 一.KaliSecurity压力测试工具 ??压力测试通过确定一个系统的瓶颈或者不能接受的性能点,来获得系统能够提供的最大的服务级别的测试.通俗地讲,压力测试是为了测试应用程序的性能会变得不可接受. ??Kali下压力测试工具包含VoIP压力测试.Web压力测试.网络压力测试及无线压力测试. 1.Voip压力测试工具 包括iaxflood和inviteflood 2.web压力测试工具:THC-SSL-DOS ??借助THC-SSL-DOS攻击工

Istio技术与实践01: 源码解析之Pilot多云平台服务发现机制

服务模型 首先,Istio作为一个(微)服务治理的平台,和其他的微服务模型一样也提供了Service,ServiceInstance这样抽象服务模型.如Service的定义中所表达的,一个服务有一个全域名,可以有一个或多个侦听端口. type Service struct { // Hostname of the service, e.g. "catalog.mystore.com" Hostname Hostname `json:"hostname"` Addre