文档章节

k-means算法 via R Language

唐荣
 唐荣
发布于 2014/11/15 10:45
字数 310
阅读 26
收藏 0
点赞 0
评论 0

dim(iris) 维度

names(iris) 列名

str(iris) 内部结构

attributes(iris数据集的属性

 iris[1:5,] , 前五行数据

iris[1:10, "Sepal.Length"] 查看数据集中属性Sepal.Length前10行数据

summary(iris)  显示数据集中每个变量的分布情况

table(iris$Species)  显示iris数据集列Species中各个值出现频次


var(iris$Sepal.Length) 方差

cov(iris$Sepal.Length, iris$Petal.Length) 相关系数


使用knn包进行Kmean聚类分析

第二步:使用knn包进行Kmean聚类分析

将数据集进行备份,将列newiris$Species置为空,将此数据集作为测试数据集
> newiris <- iris
> newiris$Species <- NULL



在数据集newiris上运行Kmean聚类分析, 将聚类结果保存在kc中。在kmean函数中,将需要生成聚类数设置为3
> (kc <- kmeans(newiris, 3)) 

创建一个连续表,在三个聚类中分别统计各种花出现的次数
> table(iris$Species, kc$cluster)       

根据最后的聚类结果画出散点图,数据为结果集中的列"Sepal.Length"和"Sepal.Width",颜色为用1,2,3表示的缺省颜色
> plot(newiris[c("Sepal.Length", "Sepal.Width")], col = kc$cluster)
在图上标出每个聚类的中心点
〉points(kc$centers[,c("Sepal.Length", "Sepal.Width")], col = 1:3, pch = 8, cex=2)

本文转载自:http://f.dataguru.cn/thread-19407-1-1.html

共有 人打赏支持
唐荣
粉丝 0
博文 17
码字总数 4081
作品 0
成都
高级程序员
机器学习之划分聚类及代码示例

一、聚类 聚类是一种无监督学习,根据样本的内在相似性/距离,将大量未知标记的样本集划分为多个类别,使得同一个类别内的样本相似度较大(距离较小),而不同类别间的样本相似度较小(距离较...

cxmscb
2017/03/16
0
0
基于改进的K-means算法在共享交通行业客户细分中的应用

对应实现代码:传送门(实现代码专注于方案的实现,k-means算法的改进并没有在代码云中体现,为方便实现直接采用sklearn标准库算法) 摘要:信息时代的来临使得企业营销焦点从产品中心转变为...

u010665216
05/30
0
0
【Spark ML源码剖析】 K-means聚类算法

原创作品,转载请标明:https://blog.csdn.net/Xiejingfa/article/details/79936737 最近在学习Spark ML的相关知识,打算写一个专栏介绍一些常用算法在Spark中的实现,今天给大家带来第一篇:...

xiejingfa
04/14
0
0
论文 - 扩展 K-Means 算法:混合数据类型的聚类

原文:Extensions to the k-means algorithm for clustering large datasets with categorical values 作者:ZHEXUE HUANG. 来源:Data mining and knowledge discovery, 1998, 2(3): 283-30......

Kofe_
07/09
0
0
Kmeans聚类算法分析(转帖)

原帖地址:http://www.opencvchina.com/thread-749-1-1.html k-means是一种聚类算法,这种算法是依赖于点的邻域来决定哪些点应该分在一个组中。当一堆点都靠的比较近,那这堆点应该是分到同一...

迈克老狼1
2013/10/24
0
0
K-Means笔记(三)数学原理

如果觉得写的好请点赞,如果觉得写的看不懂,请私信我或者评论。 如果没耐心直接到加粗的部分看EM算法的构造思路。 在之前的两篇笔记中,简介了K-Means的思路和应用场景,算法、实现和改进。...

清雨影
2015/12/31
0
0
MADlib——基于SQL的数据挖掘解决方案(26)——聚类之k-means方法

“物以类聚,人以群分”,其核心思想就是聚类。所谓聚类,就是将相似的事物聚集在一起,而将不相似的事物划分到不同的类别的过程,是数据分析中十分重要的一种手段。比如古典生物学中,人们通...

wzy0623
03/13
0
0
HAWQ + MADlib 玩转数据挖掘之(八)——聚类方法之k-means

一、聚类方法简介 所谓“物以类聚,人以群分”,其核心思想就是聚类。通过聚类,人们能意识到密集和稀疏的区域,发现全局的分布模式,以及数据属性之间有趣的相互关系。 在实践中,聚类往往为...

wzy0623
2017/08/14
0
0
数据科学家需要了解的5大聚类算法

聚类是一种涉及数据点分组的机器学习技术。给定一个数据点集,则可利用聚类算法将每个数据点分类到一个特定的组中。理论上,同一组数据点具有相似的性质或(和)特征,不同组数据点具有高度不...

【方向】
02/12
0
0
K-means聚类算法原理分析与实际应用案例分析(案例分析另起一篇博客)

引言 在数据分析中,我们常常想将看上去相似或者行为形似的数据聚合在一起。例如,对一个营销组织来说,将不同客户根据他们的特点进行分组,从而有针对性地定制营销活动,这很重要。又比如,...

u010665216
2017/11/02
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

HBase in Practice - 性能、监控及问题解决

李钰(社区ID:Yu Li),阿里巴巴计算平台事业部高级技术专家,HBase开源社区PMC&committer。开源技术爱好者,主要关注分布式系统设计、大数据基础平台建设等领域。连续4年基于HBase/HDFS设计和...

中国HBase技术社区
8分钟前
1
0
ES18-JAVA API 批量操作

1.批量查询 Multi Get API public static void multiGet() {// 批量查询MultiGetResponse response = getClient().prepareMultiGet().add("my_person", "my_index", "1")// 查......

贾峰uk
12分钟前
0
0
SpringBoot2.0使用health

1,引入actuator <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-actuator</artifactId></dependency> 2,application.properties ......

暗中观察
19分钟前
0
0
阿里巴巴Java开发规约

###编程规约 命名风格 【强制】代码中的命名均不能以下划线或美元符号开始,也不能以下划线或美元符号结束 【强制】代码中的命名严禁使用拼音与英文混合的方式,更不允许直接使用中文的方式。...

简心
24分钟前
0
0
如何用TypeScript来创建一个简单的Web应用

转载地址 如何用TypeScript来创建一个简单的Web应用 安装TypeScript 获取TypeScript工具的方式: 通过npm(Node.js包管理器) npm install -g typescript 构建你的第一个TypeScript文件 创建...

durban
28分钟前
0
0
分享好友,朋友圈自定义分享链接无效

这个问题是微信6.5.6版本以后,修改了分享规则:分享的连接必须在公众号后台设定的js安全域名内

LM_Mike
46分钟前
0
0
2018年7月23日课程

一、LVS-DR介绍 director分配请求到不同的real server。real server 处理请求后直接回应给用户,这样director负载均衡器仅处理客户机与服务器的一半连接。负载均衡器仅处理一半的连接,避免了...

人在艹木中
50分钟前
0
0
Mac下idea卡顿

idea在加载相对来说比较大的系统时,经常性出现卡顿,就是直接卡死,以至于写起代码特别难受(...极其需要耐心 最后找到的解决方案是修改idea.vmoptions中的内存大小 find / -name idea.vmop...

张欢19933
52分钟前
0
0
git提示error setting certificate verify locations

进入到你的repository 按住shift键,鼠标右键,选择git bash窗口 执行 git config --system http.sslverify false 重新回到Idea中,重新push,输入用户和密码 push 成功 如果打开git bash窗口...

特拉仔
今天
0
0
shell练习题20180723

编写shell脚本,计算1-100的和; [root@yong-01 20180723]# vim sum100.sh#!/bin/bashsum=0for i in `seq 1 100`do sum=$[$sum+$i]doneecho $sum 编写shell脚本,要求输入...

lyy549745
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部