文档章节

Weka 开发[1]-Instances类

pior
 pior
发布于 2015/10/17 22:17
字数 292
阅读 230
收藏 1

       言归正传,开始介绍Weka,先google一下,把Weka软件下载下来,在Weka的目录中有一个weka.jar的包。

       把包添加到工程中后,就可以调用weka中的函数了。

       再介绍一点weka的基本知识,在weka的目录下,有一个data的文件夹,里面存放的是一些数据集,以第一个数据集contact-lenses.arff为例,用EditPlus或是别的编辑器打开数据集,以%开头的表示的是一些注释,@relation表示这个数据集的名字,@attribute 表示属性的属性,@data 后就是数据集了,一般来说最后一列是类别(在LibSVM中第一列是类别)。

       下面我写了一个微不足道的一个weka的入门代码:

package instanceTest;
import java.io.FileReader;
import weka.core.Instances;
 
public class InstanceTest
{
    public static Instances getFileInstances( String fileName ) throws Exception
    {
        FileReader frData = new FileReader( fileName );
          Instances data = new Instances( frData );
        
          return data;
    }
    
    public static void main(String[] args) throws Exception
    {
Instances instances = getFileInstances( "F://Program Files//Weka-3-4//data//contact-lenses.arff");
        
        //把数据集全部输入出
        //System.out.println( instances );
        
        //用numInstances可以获得数据集中有多少样本
        for( int i = 0; i < instances.numInstances(); i++ )
        {
            //instance( i )是得到第i个样本
            System.out.println( instances.instance( i ) );
        }
    }
}

本文转载自:

共有 人打赏支持
pior
粉丝 26
博文 151
码字总数 22496
作品 0
济南
高级程序员
私信 提问
数据预处理和weka.filters的使用--数据挖掘学习和weka使用(三)

上一篇介绍了arff格式,这是weka专有格式,一般情况需要我们从其他数据源抽取或者获得。weka支持从cvs转化,也可以从数据库中抽取,界面如下图 weka安装目录有一个data目录,里面有一些测试数...

长平狐
2013/11/25
1K
0
RIpple-DOwn Rule算法和weka中Rider使用--数据挖掘学习和weka使用(五)

RIpple-DOwn Rule算法简介 RIpple-DOwn Rule算法(链波下降规则)是一种专家系统方法论,它是澳大利亚新南威尔士大学的Compton教授于1989年提出。它是一种用于知识表示和获取的方法。从某种意...

长平狐
2013/11/25
240
0
Weka开发[2]-分类器类

这次介绍如何利用weka里的类对数据集进行分类,要对数据集进行分类,第一步要指定数据集中哪一列做为类别,如果这一步忘记了(事实上经常会忘记)会出现“Class index is negative (not set)...

pior
2015/10/17
534
0
Weka manual 3.6翻译: 16.2 数据载入

最近谷歌译员访问很是不顺,翻译只能先放着了 这篇的格式也不调了,每次粘贴过来都要手动调整格式,太累了,也不知是我格式的问题还是OSC博客的问题 看不顺的话可以点这,会好些。 16.2 数据...

Honghe
2012/11/25
0
0
OneR算法和weka中OneR使用--数据挖掘学习和weka使用(四)

OneR算法简介 OneR又称1-R,是1993出现的一种极为简单的分类算法模型,它可以产生一个单层的决策树。 OneR算法是一个简单、廉价的方法,但是常常能够获得一个非常好的结果,用于描述数据中的...

长平狐
2013/11/25
302
0

没有更多内容

加载失败,请刷新页面

加载更多

MariaDB 服务器在 MySQL Workbench 备份数据的时候出错如何解决

服务器是运行在 MariaDB 10.2 上面的,在使用 MySQL Workbench 出现错误: mysqldump: Couldn't execute 'SELECT COLUMN_NAME, JSON_EXTRACT(HISTOGRAM, '$."number-of-buckets-specified"'......

honeymose
今天
2
0
apache顶级项目(二) - B~C

apache顶级项目(二) - B~C https://www.apache.org/ Bahir Apache Bahir provides extensions to multiple distributed analytic platforms, extending their reach with a diversity of s......

晨猫
今天
6
0
day152-2018-11-19-英语流利阅读

“超级食物”竟然是营销噱头? Daniel 2018-11-19 1.今日导读 近几年来,超级食物 superfoods 开始逐渐走红。不难发现,越来越多的轻食餐厅也在不断推出以超级食物为主打食材的健康料理,像是...

飞鱼说编程
今天
12
0
SpringBoot源码:启动过程分析(二)

接着上篇继续分析 SpringBoot 的启动过程。 SpringBoot的版本为:2.1.0 release,最新版本。 一.时序图 一样的,我们先把时序图贴上来,方便理解: 二.源码分析 回顾一下,前面我们分析到了下...

Jacktanger
昨天
4
0
Apache防盗链配置,Directory访问控制,FilesMatch进行访问控制

防盗链配置 通过限制referer来实现防盗链的功能 配置前,使用curl -e 指定referer [root@test-a test-webroot]# curl -e "http://www.test.com/1.html" -x127.0.0.1:80 "www.test.com/1.jpg......

野雪球
昨天
7
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部