文档章节

Weka 开发[1]-Instances类

pior
 pior
发布于 2015/10/17 22:17
字数 292
阅读 228
收藏 1
点赞 0
评论 0

       言归正传,开始介绍Weka,先google一下,把Weka软件下载下来,在Weka的目录中有一个weka.jar的包。

       把包添加到工程中后,就可以调用weka中的函数了。

       再介绍一点weka的基本知识,在weka的目录下,有一个data的文件夹,里面存放的是一些数据集,以第一个数据集contact-lenses.arff为例,用EditPlus或是别的编辑器打开数据集,以%开头的表示的是一些注释,@relation表示这个数据集的名字,@attribute 表示属性的属性,@data 后就是数据集了,一般来说最后一列是类别(在LibSVM中第一列是类别)。

       下面我写了一个微不足道的一个weka的入门代码:

package instanceTest;
import java.io.FileReader;
import weka.core.Instances;
 
public class InstanceTest
{
    public static Instances getFileInstances( String fileName ) throws Exception
    {
        FileReader frData = new FileReader( fileName );
          Instances data = new Instances( frData );
        
          return data;
    }
    
    public static void main(String[] args) throws Exception
    {
Instances instances = getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff");
        
        //把数据集全部输入出
        //System.out.println( instances );
        
        //用numInstances可以获得数据集中有多少样本
        for( int i = 0; i < instances.numInstances(); i++ )
        {
            //instance( i )是得到第i个样本
            System.out.println( instances.instance( i ) );
        }
    }
}

本文转载自:

共有 人打赏支持
pior
粉丝 25
博文 151
码字总数 22496
作品 0
济南
高级程序员
数据预处理和weka.filters的使用--数据挖掘学习和weka使用(三)

上一篇介绍了arff格式,这是weka专有格式,一般情况需要我们从其他数据源抽取或者获得。weka支持从cvs转化,也可以从数据库中抽取,界面如下图 weka安装目录有一个data目录,里面有一些测试数...

长平狐
2013/11/25
1K
0
RIpple-DOwn Rule算法和weka中Rider使用--数据挖掘学习和weka使用(五)

RIpple-DOwn Rule算法简介 RIpple-DOwn Rule算法(链波下降规则)是一种专家系统方法论,它是澳大利亚新南威尔士大学的Compton教授于1989年提出。它是一种用于知识表示和获取的方法。从某种意...

长平狐
2013/11/25
240
0
Weka开发[2]-分类器类

这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现“Class index is negative (not set)...

pior
2015/10/17
534
0
Weka manual 3.6翻译: 16.2 数据载入

最近谷歌译员访问很是不顺,翻译只能先放着了 这篇的格式也不调了,每次粘贴过来都要手动调整格式,太累了,也不知是我格式的问题还是OSC博客的问题 看不顺的话可以点这,会好些。 16.2 数据...

Honghe
2012/11/25
0
0
OneR算法和weka中OneR使用--数据挖掘学习和weka使用(四)

OneR算法简介 OneR又称1-R,是1993出现的一种极为简单的分类算法模型,它可以产生一个单层的决策树。 OneR算法是一个简单、廉价的方法,但是常常能够获得一个非常好的结果,用于描述数据中的...

长平狐
2013/11/25
302
0
Weka manual 3.6翻译: 16.5 过滤

16.5 过滤 在WEKA中,过滤器用来进行数据预处理。他们可以在weka.filters包中找到。各过滤器可归为以下两类别之一: • 有监督 -过滤器需要设置一个类属性。 • 无监督 - 类的属性可以不存在...

Honghe
2012/11/27
0
0
运行不了,程序错误,可能是kmeans.setDistanceFunction(distF);

@abstract 你好,想跟你请教个问题: package driftingDetection; import java.io.File; import java.io.FileWriter; import java.io.IOException; import moa.classifiers.bayes.NaiveBayes......

abstract
2016/10/21
54
0
Weka manual 3.6翻译: 16.6 分类

若觉排版不好,可点这里。 16.6 分类 在WEKA内,分类和回归算法都被称为“分类”,并都位于 weka.classifiers 包中。本节包括以下主题: • 建立一个分类 -批量和增量学习。 • 评价一个分类...

Honghe
2012/11/28
0
1
Weka 3.7.12源码学习、阅读、分析(3)

首先需要指出的是,笔者认为,阅读Weka相关算法实现的源码之前,应该对所阅读的算法有原理上的认识与理解,这样才会在阅读时有所心得和收获。也正是因为这个原因,不再对算法的原理做出交代,...

srcool
2016/11/05
72
0
Weka开发[11]—J48源代码介绍

这次介绍一下J48的源码,分析J48的源码似乎真还是有用的,同学改造J48写过VFDT,我自己用J48进行特征选择(当然很失败)。 J48的buildClassfier函数: public void buildClassifier(Instance...

pior
2015/10/20
190
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Confluence 6 配置时间和日期格式

你可以修改你 Confluence 为用户显示的时期和时间格式。设置的句法使用的是 SimpleDateFormat class,请参考 Java SimpleDateFormat 文档中的内容来设置日期和时间格式。 有下面 3 个时间和日...

honeymose
4分钟前
0
0
php seralize unserialize

关于PHP 序列化(serialize)和反序列化(unserialize)出现错误(Error at offset)的解决办法。 首先我们分析一下为什么会出现这个错误: 编码问题 UTF-8: ANSI: 我发现在我的机器上边编码改...

yeahlife
11分钟前
0
0
七、JSP九大内置对象和四个作用域

九大内置对象: request:类型是HttpServletRequest,和Servlet里的HttpServletRequest一模一样。 response:类型是HttpServletResponse,和Servlet里的HttpServletResponse一模一样。JSP里基...

Wakeeee_
14分钟前
0
0
第十四章NFS服务搭建与配置

14.1 NFS介绍 NFS介绍 NFS是Network File System的缩写;这个文件系统是基于网路层面,通过网络层面实现数据同步 NFS最早由Sun公司开发,分2,3,4三个版本,2和3由Sun起草开发,4.0开始Netap...

Linux学习笔记
46分钟前
0
0
双向认证-nginx

1、设置容器 docker run -it --name nginx-test2 -v /home/nginx:/apps -v /home/nginx/conf/nginx.conf:/etc/nginx/nginx.conf:ro -p 8183:80 -p 7443:443 -d nginx:stable 2、修改nginx配......

hotsmile
47分钟前
0
0
深入了解 Java 自动内存管理机制及性能优化

一图带你看完本文 一、运行时数据区域 首先来看看Java虚拟机所管理的内存包括哪些区域,就像我们要了解一个房子,我们得先知道这个房子大体构造。根据《Java虚拟机规范(Java SE 7 版)》的规...

Java大蜗牛
49分钟前
4
0
SpringBoot | 第六章:常用注解介绍及简单使用

前言 之前几个章节,大部分都是算介绍springboot的一些外围配置,比如日志 配置等。这章节开始,开始总结一些关于springboot的综合开发的知识点。由于SpringBoot本身是基于Spring和SpringMvc...

oKong
49分钟前
9
0
云数据库架构演进与实践

如今,大型企业如金融企业和银行等,在下一代的微服务架构转型要求下,需要基础软件和数据平台能够实现原生的云化,以满足微服务架构的需求。 微服务,也就是一种面向服务的,有特定边界的松...

巨杉数据库
50分钟前
0
0
Linux系统梳理---系统搭建(一):jdk卸载与安装

1.去官网下载符合Linux版本的jdk,暂用jdk-8u171-linux-x64.rpm 2.登陆Linux,进入usr目录,创建java目录(方便管理,可以其他位置):mkdir java 3.上传下载的jdk包至Linux服务器,使用rz指令(sz f...

勤奋的蚂蚁
今天
0
0
Linux Kernel 4.16 系列停止维护,用户应升级至 4.17

知名 Linux 内核维护人员兼开发人员 Greg Kroah-Hartman 近日在发布 4.16.18 版本的同时,宣布这是 4.16 系列的最后一个维护版本,强烈建议用户立即升级至 4.17 系列。 Linux 4.16 于 2018 年...

六库科技
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部