Weka 入门1

本人也是借鉴网上他人资料。主要介绍使用java调用Weka库。

首先介绍weka,Weka的全名是怀卡托智能分析环境,是基于开源环境的机器学习和数据挖掘软件。我们可以去weka官网下载最新的Weka软件,目前最新版本是3.7.9。默认安装会保存

在C:\Program Files\Weka-3-7目录下,目录下有一个data的文件夹,里面存放的是一些数据集,我们也可以把data文件拷到别的地方更方便调用,这里面的数据可以用于我们学习Weka的使用。我们以data文件夹中的一个.arff文件为例对文件格式进行说明,如下图:

(1)关系声明

格式为@relation <relation-name>在文件的第一行,关系名称不能有空格,如有空格需要用加上引号。

(2)属性说明

格式为@attribute <attribute-name> <data-type>

attribute-name是属性名称,区分大小写。data-type是数据类型,常用类型有numeric(数值型:整数,小数等)nominal(分类型:举个例子如@attribute outlook{sunny,overcast,rainy},取值集合就是后面sunny,overcast,rainy)

(3)数据说明

数据信息以@data作为标志。

在@data下面的行中,每一行作为一个例子,包含了所以已经声明的属性,如果属性值为空则要求用“ ?”来代替

下面我们便使用java简单调用Weka使用,软件的使用在这里不介绍,这里只说明如何对weka进行2次开发。

Instances:我们可以认为它是数据集的实例集合。

package InstanceTest;
import weka.core.Instances;

import java.io.*;
public class InstanceTest {

/**
* @param args
*/

public static Instances GetInstance(String FileName)throws Exception
{
FileReader reader=new FileReader(FileName);
Instances data=new Instances(reader);
return data;
}

public static void main(String[] args) {
// TODO Auto-generated method stub
try
{
Instances date=GetInstance("D://train.arff");
// System.out.print(date); 全部输出数据集或者也可以使用numInstances循环输出
for(int i=0;i<date.numInstances();i++)
{
System.out.println(date.instance(i));

}

}
catch(Exception e)
{
e.printStackTrace();
}
}

}

Weka 入门1,布布扣,bubuko.com

时间: 2024-10-13 10:58:05

Weka 入门1的相关文章

Weka 入门2

现在我们介绍使用Weka来对数据进行分类.对数据进行分类,我们必须先指定那一列作为预测类别.因为数据文件格式的问题,类别一般都是最后一列属性.我们可以使用setClassIndex来设置类别.然后我们要选择分类器,分类器有很多,我们暂时使用J48分类器.对数据进行训练可以使用buildClassifier,然后我们可以用classifyInstance来查看训练数据预测的类别值.当然预测的类别会用数值表示,比如0,1,2....代表预测的值属于第几个类别.例如类别的值为{sunny,rainy}

Weka 入门3

这次我们介绍Evaluation类.在上一次中我们只是单纯的预测了分类值,并没有其他评价数据.这场我们使用Evalution类.首先初始化一个Evaluation对象,Evaluation类没有无参的构造函数,一般用Instances对象作为构造函数的参数.如果我们没有训练数据和测试数据,那么我们可以使用Cross Validation验证方式,即交叉验证.Cross ValidateModel方法的四个参数分别为,第一个是分类器,第二个是在某个数据集上评价的数据集,第三个参数是交叉检验的次数(

weka入门

每天都必须记录自己的一点一滴,不记录下来,过一段时间就会忘记,忘记了就等于没有经历过.我不能每天这样浑浑噩噩的过下去.我要有计划,有梦想,追求卓越,成就不同. 我今天开始我的学习weka之路.学的时候我在质疑,我为什么要学weka?难道只是为了在读研的同学面前炫耀:看我工程做的不错,研究能力也不赖,哈哈!还是只是追求潮流技术?还是只是想证明自己还是优秀的,我和别人不一样?最终我的答案是如果不学,我什么也得不到,但是学了,如果有用,那么值了,就算没用,那我也避免了自己滑向堕落! 废话不多说,先看我

毕业课题思考记录

用这篇日志记录在做毕业课题的一些思考,按时间分割. 2014/02至2014/04:      抽了一些时间,看林轩田老师的<机器学习基石>,大致对机器学习.数据挖掘有了一个认识,数据挖掘更侧重于挖掘大量或潜在的数据,从而对一些问题进行分析,机器学习则是通过大量已知数据的训练,形成机器的思维,从而"学会"对接下来的数据产生比较接近人类思维的反应.      <基石>的视频只看了三分之一,主要就是对PLA算法构造分类器有了个整体印象,大意应该是,用线上学习的方式,

推荐数据挖掘入门教材《数据挖掘与机器学习 WEKA应用技术与实践》

该书由于去年刚出比较新,所以很难在网上下载到电子书,本人很幸运找到了前两章的电子版,而第二章又是本书的关键,所以建议大家先看看第二章,如果觉的写的好,可以再买书,或寻求电子版的全书,下载前两章请到:http://download.csdn.net/detail/u010968153/8686369 图书简介: 本书借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离.全书共分8章,主要内容包括Weka

Weka安装和一简单例子入门

Download from http://www.cs.waikato.ac.nz/ml/weka for Windows, Mac, Linux 安装,可改路径 安好,如下 运行 点开erxplore,出现 点open file,打开数据文件 安装目录下又点数据文件,如下图的data文件夹里,也可讲其复制到常用的文件夹里,方便每次使用. 打开数据文件夹的一个数据文件为例,如weather.nominal 之后这样的界面,多观察看看各种属性和标签按钮,慢慢熟悉 点击edit按钮,出现如下数据的表

Weka 3: Data Mining Software in Java

官方网站: Weka 3: Data Mining Software in Java   相关使用方法博客: WEKA使用教程(经典教程转载) Weka初步一.二.三.四 使用Weka进行数据挖掘 一个小时速度入门数据挖掘WEKA(一个完整的小例子)   百度文库: WEKA中文详细教程(全) WEKA 3-5-3 Experimenter 指南 数据挖掘工具(weka教程)

漫谈数据挖掘从入门到进阶

入门: 数据挖掘入门的书籍,中文的大体有这些: Jiawei Han的<数据挖掘概念与技术> Ian H. Witten / Eibe Frank的<数据挖掘 实用机器学习技术> Tom Mitchell的<机器学习> TOBY SEGARAN的<集体智慧编程> Anand Rajaraman的<大数据> Pang-Ning Tan的<数据挖掘导论> Matthew A. Russell的<社交网站的数据挖掘与分析> 很多

【转】机器学习最佳入门学习资料汇总

机器学习最佳入门学习资料汇总 专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门. 这篇文章的确很难写,因为我希望它真正地对初学者有帮助.面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的库,教程,论文及书籍帮助他们入门? 资源的取舍很让人纠结,我不得不努力从一个机器学习的程序员和初学者的角度去思考哪些资源才是最适合他们的. 我为每种类型的资源选出了其中最佳的学习资料.如果你是一个真正的初学者,并且有兴趣开始机器学习领域的学习,我希望