文档章节

Orange-数据挖掘和机器学习软件

openthings
 openthings
发布于 2015/12/22 09:41
字数 603
阅读 4669
收藏 4

Orange(http://orange.biolab.si/)是一个基于组件的数据挖掘和机器学习软件套装,支持Python进行脚本开发。Orange由斯洛文尼亚大学计算与信息学系的生物信息实验室BioLab进行开发,https://github.com/biolab 是一个实际应用的项目而不仅仅是技术工程,包含了该组织托管的相关开源工程。

这里有不少关于数据挖掘和分析的文章(英文的,有时间了慢慢翻译一些):http://blog.biolab.si/

Orange操作简单,但功能很强大,可以使用Python强大的扩展库资源。具有快速而又多功能的可视化编程前端,以便浏览数据分析和可视化。

Orange包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目、过渡、建模、模式评估和勘探的功能。其由C++ 和 Python开发,它的图形库是由跨平台的Qt框架构建的,可以可视化地进行操作。

安装完毕,启动:

source orange3env/bin/activate
python -m Orange.canvas

源代码托管在:

https://github.com/biolab/orange3

https://github.com/biolab/orange-bio

在Ubuntu上使用这个脚本进行安装:http://biolab.github.io/install-orange/setup-ubuntu.sh

原始文件需要更新,这个是更新后的:

#!/bin/bash

p=$PWD
sudo apt-get update
sudo apt-get -y install git python-pip python-virtualenv python3-dev 
python3-numpy python3-scipy python3-pyqt4 python-qt4-dev python3-sip-dev libqt4-dev

virtualenv -p python3 --system-site-packages orange3env
source orange3env/bin/activate

echo "/usr/lib/python3/dist-packages/" > "orange3env/lib/python3.4/site-packages/0.pth"
pip install --upgrade numpy

git clone https://github.com/biolab/orange3
cd orange3
pip install -r requirements-core.txt
pip install -r requirements-dev.txt
pip install -r requirements-doc.txt
pip install -r requirements-gui.txt
pip install -r requirements-sql.txt
python setup.py develop
cd ..
git clone https://github.com/biolab/orange-bio
cd orange-bio
python setup.py develop


下载其它的相关工程源代码:

#!/bin/bash

source orange3env/bin/activate

git clone https://github.com/biolab/orange3-text.git
git clone https://github.com/biolab/orange3-associate.git
git clone https://github.com/biolab/orange3-network.git
git clone https://github.com/biolab/orange-web.git
git clone https://github.com/biolab/ipynb.git
git clone https://github.com/biolab/orange3-datafusion.git
git clone https://github.com/biolab/orange3-example-addon.git
git clone https://github.com/biolab/datafusion-installation-guide.git
git clone https://github.com/biolab/data-mining-course-unipv.git
git clone https://github.com/biolab/qt-graph-helpers.git


© 著作权归作者所有

openthings
粉丝 322
博文 1138
码字总数 687611
作品 1
东城
架构师
私信 提问
加载中

评论(2)

i
if8
good
i
if8
good
[转]五个免费开源的数据挖掘软件

Orange Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包...

红薯
2010/12/14
20.3K
8
[转载]易上手的数据挖掘、可视化与机器学习工具: Orange介绍

标签 PostgreSQL , Orange3 , 可视化 , 时空数据 背景 可视化分析会是一个让枯燥的数据说话的快捷途径,降低可视化分析门槛,同时又保留它的编程能力,是非常重要的。 如今数据种类越来越多,...

德哥
2018/01/02
0
0
六款值得推荐的数据挖掘得力助手

当今这个时代,说数据就是金钱一点都不夸张。随着向一个基于应用的领域过渡,数据则呈现出了指数级增长。然而,大部分数据是非结构化的,因此需要一个程序和方法来从中提取有用信息,并且将其...

HappyBKs
2014/10/13
200
0
基于Celery的并行处理工程-OpenWorker快速安装

Celery 是一个简单灵活的Python并行处理框架,但是相关的几个工程需要独自安装和配置,给小白的使用带来困难。 OpenWorker是基于Python的并行处理框架,将集成Celery、Flower、Jobtastic和R...

openthings
2015/08/10
617
4
数据挖掘和机器学习软件--Orange Data Mining

Orange 是一个基于组件的数据挖掘和机器学习软件套装,它的功能即友好,又很强大,快速而又多功能的可视化编程前端,以便浏览数据分析和可视化,基绑定了 Python以进行脚本开发。它包含了完整...

匿名
2010/12/14
23.7K
1

没有更多内容

加载失败,请刷新页面

加载更多

查看线上日志常用命令

cat 命令(文本输出命令) 通常查找出错误日志 cat error.log | grep 'nick' , 这时候我们要输出当前这个日志的前后几行: 显示file文件里匹配nick那行以及上下5行 cat error.log | grep -C ...

xiaolyuh
29分钟前
5
0
六、Java设计模式之工厂方法

工厂方法定义: 定义一个创建对象的接口,但让实现这个接口的类来决定实例化哪个类,工厂方法让类的实例化推迟到子类中进行 类型:创建型 工厂方法-使用场景: 创建对象需要大量重复的代码 ...

东风破2019
35分钟前
5
0
win服务器管理遇到的一系列问题记录

有些小伙伴在使用iis7远程桌面管理工具的时候总是会遇到一系列的问题,下面就是为大家介绍一下服务器日常管理过程中出现的问题及我的解决办法和心得。希望能帮到大家。   拒绝服务器重新启...

1717197346
42分钟前
6
0
flutter 剪切板 复制粘贴

复制粘贴功能 import 'package:flutter/services.dart'; Clipboard.setData(ClipboardData(text:_text));Clipboard.getData;...

zdglf
45分钟前
4
0
如何保证消息的可靠性传输?或者说,如何处理消息丢失的问题?

面试题 如何保证消息的可靠性传输?或者说,如何处理消息丢失的问题? 面试官心理分析 这个是肯定的,用 MQ 有个基本原则,就是数据不能多一条,也不能少一条,不能多,就是前面说的重复消费...

米兜
46分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部