文档章节

iris数据集demo

KYO4321
 KYO4321
发布于 2017/06/29 11:31
字数 293
阅读 15
收藏 0
#!/usr/bin/env python
##K-means操作
import numpy as np
import pandas as pd
from sklearn import cluster #机器学习库
np.random.seed(1024) #设置随机数种子

iris = pd.read_excel('D:/data/iris_data.xlsx')

print(iris.shape) #输出数据维度
print(iris.head())#查看前5行

print(iris.describe())
print(iris.describe().T)

irisK3 = cluster.KMeans(n_clusters=3, random_state=1)
irisFeatures = iris.ix[:, 1:4]
irisK3.fit(irisFeatures)

#############
##K-means:Method two
from sklearn import metrics
from sklearn.metrics import pairwise_distances
from sklearn import datasets
dataset = datasets.load_iris()
X = dataset.data
y = dataset.target

import numpy as np
from sklearn.cluster import KMeans
kmeans_model = KMeans(n_clusters=3, random_state=1).fit(X)
labels = kmeans_model.labels_
metrics.silhouette_score(X, labels, metric='euclidean')
#####################


#############################################
##决策树操作
from sklearn.datasets import load_iris
from sklearn import cross_validation
from sklearn import tree
iris = load_iris()
target = iris.target #目标变量
data = iris.data[:, 1:4] #自变量

train_data, test_data, train_target, test_target = cross_validation.train_test_split(data,
                target, test_size = 0.24, random_state = 0) #分成训练集、测试集(占0.24)

clf = tree.DecisionTreeClassifier(criterion='gini', max_depth=6, 
                                  min_samples_split=5) #CART算法

clf_fit = clf.fit(train_data, train_target) #开始fit
#print clf_fit
train_est=clf.predict(train_data) #预测训练集
test_est=clf.predict(test_data) #预测测试集

sum=0 
for i in range(36):    
    if test_est[i] == test_target[i]:
        sum = sum + 1        
print('test_accuracy=',"%.2f%%"%(sum*1.0/36*100)) #测试集预测正确率

sum=0 
for i in range(114):    
    if train_est[i] == train_target[i]:
        sum = sum + 1        
print('tarin_accuracy=',"%.2f%%"%(sum*1.0/114*100)) #训练集预测正确率


#############
from sklearn.datasets import load_iris
from sklearn.cross_validation import cross_val_score
from sklearn.tree import DecisionTreeClassifier
clf = DecisionTreeClassifier(random_state=0)
iris = load_iris()
cross_val_score(clf, iris.data, iris.target, cv=10)

© 著作权归作者所有

共有 人打赏支持
上一篇: seg_word
下一篇: 回归分析demo
KYO4321
粉丝 3
博文 98
码字总数 54979
作品 0
深圳
程序员
私信 提问
scikit-learn的基本用法(一)——KNN算法的使用

文章作者:Tyan 博客:noahsnail.com | CSDN | 简书 本文主要使用scikit-learn中的KNN算法进行Iris数据集的分类。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽...

Quincuntial
2017/05/02
0
0
[2018-07-08] tensorflow 创建线性回归(1)

OverView: 今天突然想起以前写过一个用BP算法的iris分类器, 加上最近面试把线性规划的思想和实现又看了一遍. (1) 数据集介绍 (2) tensorflow 实现分类器 (3) tensorflow实现模型评估 (1) 数据...

斐波那契的数字
2018/07/08
0
0
预热TensorFlow2.0——IRIS数据集实战

TensorFlow 2.0 即将问世,很多API该删的删,该改的改。在这篇文章中我就2.0 版本中以下两点更新,为大家做一下预热(注意:笔者使用的是tensorflow1.9版)。 在tensorflow2.0中: 将使用 Kera...

王鹏你妹
01/16
0
0
Spark MLlib 学习入门笔记 - RDD基础

RDD(Resilient Distributed Datasets)分布式弹性数据集,将数据分布存储在不同节点的计算机内存中进行存储和处理。RDD的任务被分成两部分:Transformation和Action。Transformation用于对R...

h8b6pk7m7r8
2018/01/06
0
0
输入数据与ARFF文件--数据挖掘学习和weka使用(二)

我个人认为直接讨论数据挖掘算法和weka的使用过于心急。我一开始就直接学习的数据挖掘方法,有些方法艰涩枯燥,我常常在思考的不是方法本身,而是“这是干什么的?”。 在使用了weka后有些东...

长平狐
2013/11/25
785
0

没有更多内容

加载失败,请刷新页面

加载更多

解决各浏览器向url中传中问参数的问题

https://www.cnblogs.com/godtrue/p/4333262.html 后台的处理代码 public static String getUrlnewName( String oldName) {String newName = "";try {String agent = inv.get......

踏破铁鞋无觅处
19分钟前
1
0
微信支付携带证书请求

package utils.wechat; import java.io.File;import java.io.FileInputStream;import java.io.IOException;import java.security.KeyStore; import javax.net.ssl.SSLContext;......

猿神出窍
27分钟前
2
0
1093 - You can't specify target table 'xxx' for update in FROM clause, Time: 0.002000s

1093 - You can't specify target table 'xxx' for update in FROM clause, Time: 0.002000s 根据结果集在b_order_copy1 表中删除 DELETE FROM b_order_copy1 WHERE Id in ( SELECT Id FRO......

lwenhao
28分钟前
1
0
JavaScriptCore全面解析

本文由云+社区发表 作者:殷源,专注移动客户端开发,微软Imagine Cup中国区特等奖获得者 JavaScript越来越多地出现在我们客户端开发的视野中,从ReactNative到JSpatch,JavaScript与客户端相...

腾讯云加社区
32分钟前
1
0
Jmeter参数的AES加密使用

在Jmeter日常实践中,大家应该都遇到过接口传参需要加密的情况。以登陆为例,用户名和密码一般都需要进行加密传输,在服务端再进行解密,这样安全系数会更高,但在使用jmeter进行接口测试的时...

程序猿拿Q
43分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部