文档章节

iris数据集demo

KYO4321
 KYO4321
发布于 2017/06/29 11:31
字数 293
阅读 14
收藏 0
#!/usr/bin/env python
##K-means操作
import numpy as np
import pandas as pd
from sklearn import cluster #机器学习库
np.random.seed(1024) #设置随机数种子

iris = pd.read_excel('D:/data/iris_data.xlsx')

print(iris.shape) #输出数据维度
print(iris.head())#查看前5行

print(iris.describe())
print(iris.describe().T)

irisK3 = cluster.KMeans(n_clusters=3, random_state=1)
irisFeatures = iris.ix[:, 1:4]
irisK3.fit(irisFeatures)

#############
##K-means:Method two
from sklearn import metrics
from sklearn.metrics import pairwise_distances
from sklearn import datasets
dataset = datasets.load_iris()
X = dataset.data
y = dataset.target

import numpy as np
from sklearn.cluster import KMeans
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
metrics.silhouette_score(X, labels, metric='euclidean')
#####################


#############################################
##决策树操作
from sklearn.datasets import load_iris
from sklearn import cross_validation
from sklearn import tree
iris = load_iris()
target = iris.target #目标变量
data = iris.data[:, 1:4] #自变量

train_data, test_data, train_target, test_target = cross_validation.train_test_split(data,
                target, test_size = 0.24, random_state = 0) #分成训练集、测试集(占0.24)

clf = tree.DecisionTreeClassifier(criterion='gini', max_depth=6, 
                                  min_samples_split=5) #CART算法

clf_fit = clf.fit(train_data, train_target) #开始fit
#print clf_fit
train_est=clf.predict(train_data) #预测训练集
test_est=clf.predict(test_data) #预测测试集

sum=0 
for i in range(36):    
    if test_est[i] == test_target[i]:
        sum = sum + 1        
print('test_accuracy=',"%.2f%%"%(sum*1.0/36*100)) #测试集预测正确率

sum=0 
for i in range(114):    
    if train_est[i] == train_target[i]:
        sum = sum + 1        
print('tarin_accuracy=',"%.2f%%"%(sum*1.0/114*100)) #训练集预测正确率


#############
from sklearn.datasets import load_iris
from sklearn.cross_validation import cross_val_score
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(random_state=0)
iris = load_iris()
cross_val_score(clf, iris.data, iris.target, cv=10)

© 著作权归作者所有

共有 人打赏支持
KYO4321
粉丝 3
博文 68
码字总数 40660
作品 0
深圳
程序员
scikit-learn的基本用法(一)——KNN算法的使用

文章作者:Tyan 博客:noahsnail.com | CSDN | 简书 本文主要使用scikit-learn中的KNN算法进行Iris数据集的分类。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽...

Quincuntial
2017/05/02
0
0
[2018-07-08] tensorflow 创建线性回归(1)

OverView: 今天突然想起以前写过一个用BP算法的iris分类器, 加上最近面试把线性规划的思想和实现又看了一遍. (1) 数据集介绍 (2) tensorflow 实现分类器 (3) tensorflow实现模型评估 (1) 数据...

斐波那契的数字
07/08
0
0
[雪峰磁针石博客]scikit-learn_cookbook1: 高性能机器学习-NumPy

源码下载 在本章主要内容: NumPy基础知识 加载iris数据集 查看iris数据集 用pandas查看iris数据集 用NumPy和matplotlib绘图 最小机器学习配方 - SVM分类 介绍交叉验证 以上汇总 机器学习概述...

Python测试开发人工智能
07/27
0
0
Spark MLlib 学习入门笔记 - RDD基础

RDD(Resilient Distributed Datasets)分布式弹性数据集,将数据分布存储在不同节点的计算机内存中进行存储和处理。RDD的任务被分成两部分:Transformation和Action。Transformation用于对R...

h8b6pk7m7r8
01/06
0
0
全面了解R语言中的k-means如何聚类?

下面将在iris数据集上演示k-means聚类的过程。 先从iris数据集中移除Species属性,然后再对数据集iris调用函数kmeans,并将聚类结果存储在变kmeans.result中。 在下面的代码中,簇的数目设置...

zlw东南风
2017/11/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

java工程师用spring boot和web3j构建以太坊区块链应用

区块链最近IT世界的流行语之一。这项有关数字加密货币的技术,并与比特币一起构成了这个热门的流行趋势。它是去中心化的,不可变的分块数据结构,这是可以安全连接和使用的密码算法。在这种结...

笔阁
1分钟前
0
0
聊聊sentinel的SentinelWebAutoConfiguration

序 本文主要研究一下sentinel的SentinelWebAutoConfiguration SentinelWebAutoConfiguration spring-cloud-alibaba-sentinel-autoconfigure-0.2.0.BUILD-SNAPSHOT-sources.jar!/org/springf......

go4it
3分钟前
0
0
java ArrayList 根据对象内的属性排序

//根据修改时间排序Comparator com = new Comparator<ReleaseInfo>() {public int compare(ReleaseInfo reInfo1, ReleaseInfo reInfo2) { //return reInfo2.getModifyTime().c......

成长中的小白
4分钟前
0
0
PowerDesigner p f m

(非原创) P:PirmaryKey 主键 F:ForeignKey 外键 M:Mandatory 强制要求(不能为空) 主键: 主键是数据表的唯一索引,比如学生表里有学号和姓名,姓名可能有重名的,但学号确是唯一的,你要从...

森火
4分钟前
0
0
Nexus Repository Manager 搭建私有docker仓库

Nexus Repository Manager 搭建私有docker仓库 2018年05月08日 14:44:23 阅读数:115 1.下载nexus3的镜像: docker pull sonatype/nexus3 2.使用镜像启动一个容器: docker run -d --name n...

linjin200
5分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部