文档章节

R语言聚类算法之密度聚类(Density-based Methods)

C
 Claroja
发布于 2017/05/08 23:21
字数 429
阅读 13
收藏 0

1.原理解析:
1.从数据集中选择一个未处理的样本点
2.以1为圆心,做半径为E的圆,由于圆内圈入点的个数为3,满足密度阈值Minpts,因此称点1为核心对象(黑色实心圆点),且将圈内的4个点形成一个簇,其中点1直接密度可达周围的3个灰色实心原点;
3.重复步骤2若干次,其中点1直接密度可达核心对象3,且点2密度可达点3.
4.当该过程进行到图Ⅳ,4的E邻域内仅有2个点,小雨阈值MinPts,因此点4为边缘点(非核心对象),记为ⓧ,继续考察其他点.
5.当所有对象都被考察,该过程结束,得到图Ⅷ.椭圆形内有若干核心对象和边缘点,这些点都是密度相连的.
6.为个点归类,如图Ⅸ:点集黑圈相互密度可达,属于类别1:点集黑三角相互密度可达,属于新的一类,记为类别2;点集白圈与类别1样本点密度相连,属于类别3;点集白三角与类别2样本点密度相连,属于类别4;点 ⓧ既非核心对象,也不密度相连,为噪声点.
R语言聚类算法之密度聚类(Density-based Methods)
2.在R语言中的应用
密度聚类(Density-based Methods)主要应用到了fpc包中的dbscan函数。
dbscan(data,eps,MinPts=5,scale=FALSE,method=c(“hybird”,”raw”,”dist”),seeds=TRUE,showplot=FALSE,countmode=NULL)
3.以iris数据集为例进行分析
1)应用模型并查看模型的相应参数
ds=dbscan(iris[,-5],eps=0.3,MinPts=4)
ds[1:length(ds)]
R语言聚类算法之密度聚类(Density-based Methods)

© 著作权归作者所有

共有 人打赏支持
C
粉丝 0
博文 128
码字总数 44892
作品 0
南京
R语言学习笔记之聚类分析

使用k-means聚类所需的包: factoextra cluster #加载包 library(factoextra) library(cluster)l #数据准备 使用内置的R数据集USArrests #load the dataset data("USArrests") #remove any m......

R语言中文社区
01/16
0
0
深入浅出——基于密度的聚类方法

本文原作者:微信公众号“燕哥带你学算法”团队的祝烨 博士,目前在墨尔本从事博士后研究。 “The observation of and the search forsimilarities and differences are the basis of all hu...

u013709270
2017/09/10
0
0
R语言之高级数据分析「聚类分析」

作者简介Introduction 姚某某 知乎专栏:https://zhuanlan.zhihu.com/mydata 这一节主要总结数据分析中聚类分析的思想。 聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分...

R语言中文社区
04/20
0
0
数据挖掘-聚类分析(Python实现K-Means算法)

概念: 聚类分析(cluster analysis ):是一组将研究对象分为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析,或者数值分类。聚类的输入是一组未被标记的样本,聚类根据数...

蜘蛛侠不会飞
07/19
0
0
R语言可视化学习笔记之相关矩阵可视化包ggcorrplot

基于ggplot2包以及corrplot包的相关矩阵可视化包ggcorrplot,ggcorrplot包提供对相关矩阵重排序以及在相关图中展示显著性水平的方法,同时也能计算相关性p-value 安装方法就不提了,不懂的可...

R语言中文社区
01/25
0
0

没有更多内容

加载失败,请刷新页面

加载更多

20.27 分发系统介绍~ 20.30 expect脚本传递参数

分发系统介绍分发系统-expect讲解(也就是一个分发的脚本)场景:业务越来越大,网站app,后端,编程语言是php,所以就需要配置lamp或者lnmp,最好还需要吧代码上传到服务器上;但是因...

洗香香
26分钟前
1
0
设计一个百万级的消息推送系统

前言 首先迟到的祝大家中秋快乐。 最近一周多没有更新了。其实我一直想憋一个大招,分享一些大家感兴趣的干货。 鉴于最近我个人的工作内容,于是利用这三天小长假憋了一个出来(其实是玩了两...

crossoverJie
32分钟前
1
0
软件架构:5种你应该知道的模式

Singleton(单例模式)、仓储模式(repository)、工厂模式(factory)、建造者模式(builder)、装饰模式(decorator)……大概每个上课听讲的程序员都不会陌生——软件的设计模式为我们提供...

好雨云帮
44分钟前
2
0
OSChina 周二乱弹 —— 这只是一笔金钱交易

Osc乱弹歌单(2018)请戳(这里) 【今日歌曲】 @小小编辑:推荐歌曲《暮春秋色》- 窦唯 / 译乐队 《暮春秋色》- 窦唯 / 译乐队 手机党少年们想听歌,请使劲儿戳(这里) @我没有抓狂:跨服聊...

小小编辑
56分钟前
617
16
df命令、du命令 、磁盘分区

9月25日任务 4.1 df命令 4.2 du命令 4.3/4.4 磁盘分区 4.1、命令 :df #磁盘空间使用情况 [root@zgxlinux-02 ~]# df 按字节显示 1000Byte=1KB 1000KB=1MB 1000MB=1GB ...

zgxlinux
今天
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部