文档章节

iris数据集demo

KYO4321
 KYO4321
发布于 2017/06/29 11:31
字数 293
阅读 102
收藏 0

钉钉、微博极速扩容黑科技,点击观看阿里云弹性计算年度发布会!>>>

#!/usr/bin/env python
##K-means操作
import numpy as np
import pandas as pd
from sklearn import cluster #机器学习库
np.random.seed(1024) #设置随机数种子

iris = pd.read_excel('D:/data/iris_data.xlsx')

print(iris.shape) #输出数据维度
print(iris.head())#查看前5行

print(iris.describe())
print(iris.describe().T)

irisK3 = cluster.KMeans(n_clusters=3, random_state=1)
irisFeatures = iris.ix[:, 1:4]
irisK3.fit(irisFeatures)

#############
##K-means:Method two
from sklearn import metrics
from sklearn.metrics import pairwise_distances
from sklearn import datasets
dataset = datasets.load_iris()
X = dataset.data
y = dataset.target

import numpy as np
from sklearn.cluster import KMeans
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
metrics.silhouette_score(X, labels, metric='euclidean')
#####################


#############################################
##决策树操作
from sklearn.datasets import load_iris
from sklearn import cross_validation
from sklearn import tree
iris = load_iris()
target = iris.target #目标变量
data = iris.data[:, 1:4] #自变量

train_data, test_data, train_target, test_target = cross_validation.train_test_split(data,
                target, test_size = 0.24, random_state = 0) #分成训练集、测试集(占0.24)

clf = tree.DecisionTreeClassifier(criterion='gini', max_depth=6, 
                                  min_samples_split=5) #CART算法

clf_fit = clf.fit(train_data, train_target) #开始fit
#print clf_fit
train_est=clf.predict(train_data) #预测训练集
test_est=clf.predict(test_data) #预测测试集

sum=0 
for i in range(36):    
    if test_est[i] == test_target[i]:
        sum = sum + 1        
print('test_accuracy=',"%.2f%%"%(sum*1.0/36*100)) #测试集预测正确率

sum=0 
for i in range(114):    
    if train_est[i] == train_target[i]:
        sum = sum + 1        
print('tarin_accuracy=',"%.2f%%"%(sum*1.0/114*100)) #训练集预测正确率


#############
from sklearn.datasets import load_iris
from sklearn.cross_validation import cross_val_score
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(random_state=0)
iris = load_iris()
cross_val_score(clf, iris.data, iris.target, cv=10)
上一篇: 时间序列DEMO
下一篇: 回归分析demo
KYO4321
粉丝 4
博文 150
码字总数 88587
作品 0
深圳
程序员
私信 提问
加载中
请先登录后再评论。
scikit-learn的基本用法(一)——KNN算法的使用

文章作者:Tyan 博客:noahsnail.com | CSDN | 简书 本文主要使用scikit-learn中的KNN算法进行Iris数据集的分类。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽...

Quincuntial
2017/05/02
0
0
AI学习--机器学习概述

学习框架 01-人工智能概述 机器学习、人工智能与深度学习的关系 达特茅斯会议-人工智能的起点 机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来(人工神经网络) 从图上...

小a玖拾柒
2019/03/07
0
0
AI学习--机器学习概述

学习框架 01-人工智能概述 机器学习、人工智能与深度学习的关系 达特茅斯会议-人工智能的起点 机器学习是人工智能的一个实现途径 深度学习是机器学习的一个方法发展而来(人工神经网络) 从图上...

osc_gxtueyne
2019/03/07
2
0
k-means算法 via R Language

dim(iris) 维度 names(iris) 列名 str(iris) 内部结构 attributes(iris) 数据集的属性 iris[1:5,] , 前五行数据 iris[1:10, "Sepal.Length"] 查看数据集中属性Sepal.Length前10行数据 summ......

唐荣
2014/11/15
48
0
(转载)基于sklearn的iris数据集及简介

(一)iris数据集简介 Iris数据集是机器学习任务中常用的分类实验数据集,由Fisher在1936收集整理。Iris中文名是安德森鸢尾花卉数据集,英文全称是Anderson’s Iris data set,是一类多重变量...

奋斗的小炎
03/31
0
0

没有更多内容

加载失败,请刷新页面

加载更多

element ui设置表格表头高度和每一行的高度

填坑记录:今天用element ui的表格组件做用户信息展示,直接拉取的官网的代码过来,发现表头和每一行都太高了,如下:      因为第一次使用element ui的表格组件,不太清楚会遇到这样的坑...

osc_bwy4ep83
6分钟前
13
0
逆向破解之160个CrackMe —— 001

CrackMe —— 001 160 CrackMe 是比较适合新手学习逆向破解的CrackMe的一个集合一共160个待逆向破解的程序 CrackMe:它们都是一些公开给别人尝试破解的小程序,制作 crackme 的人可能是程序员...

osc_xmvqghwh
7分钟前
6
0
【.NET Core项目实战-统一认证平台】第九章 授权篇-使用Dapper持久化IdentityServer4

【.NET Core项目实战-统一认证平台】开篇及目录索引 上篇文章介绍了IdentityServer4的源码分析的内容,让我们知道了IdentityServer4的一些运行原理,这篇将介绍如何使用dapper来持久化Ident...

osc_9ntog5yq
8分钟前
9
0
用SV写一个蒙哥马利模乘的参考模型

前言 往期推送过一个蒙哥马利算法的介绍,如果要实现蒙哥马利模乘的硬件模块,那么一个参考模型是必不可少的,这一期将利用SV实现一个简单的参考模型,这个参考模型可以直接用于功能仿真 根据...

osc_f9krav3q
9分钟前
4
0
缓存数据库

缓存数据库 NoSQL(NoSQL = Not Only SQL),意即泛指非关系型数据库,(关系型数据库mysql,sqlite,oracle,即存在强烈的数据关系),是对不同于传统的关系型数据库的数据库管理系统的统称。...

osc_lqb3vmrs
10分钟前
12
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部