k-means算法 via R Language
博客专区 > 唐荣 的博客 > 博客详情
k-means算法 via R Language
唐荣 发表于3年前
k-means算法 via R Language
  • 发表于 3年前
  • 阅读 22
  • 收藏 0
  • 点赞 0
  • 评论 0

新睿云服务器60天免费使用,快来体验!>>>   

dim(iris) 维度

names(iris) 列名

str(iris) 内部结构

attributes(iris数据集的属性

 iris[1:5,] , 前五行数据

iris[1:10, "Sepal.Length"] 查看数据集中属性Sepal.Length前10行数据

summary(iris)  显示数据集中每个变量的分布情况

table(iris$Species)  显示iris数据集列Species中各个值出现频次


var(iris$Sepal.Length) 方差

cov(iris$Sepal.Length, iris$Petal.Length) 相关系数


使用knn包进行Kmean聚类分析

第二步:使用knn包进行Kmean聚类分析

将数据集进行备份,将列newiris$Species置为空,将此数据集作为测试数据集
> newiris <- iris
> newiris$Species <- NULL



在数据集newiris上运行Kmean聚类分析, 将聚类结果保存在kc中。在kmean函数中,将需要生成聚类数设置为3
> (kc <- kmeans(newiris, 3)) 

创建一个连续表,在三个聚类中分别统计各种花出现的次数
> table(iris$Species, kc$cluster)       

根据最后的聚类结果画出散点图,数据为结果集中的列"Sepal.Length"和"Sepal.Width",颜色为用1,2,3表示的缺省颜色
> plot(newiris[c("Sepal.Length", "Sepal.Width")], col = kc$cluster)
在图上标出每个聚类的中心点
〉points(kc$centers[,c("Sepal.Length", "Sepal.Width")], col = 1:3, pch = 8, cex=2)

  • 打赏
  • 点赞
  • 收藏
  • 分享
共有 人打赏支持
粉丝 0
博文 16
码字总数 4081
×
唐荣
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: