文档章节

机器学习---第七讲---聚类的基础知识

Betty__
 Betty__
发布于 2016/10/27 19:06
字数 387
阅读 51
收藏 0

1.聚类分析概述

目前为止,我们了解了回归和分类。他们都属于监督式机器学习supervised machine learning。在监督式机器学习中,你训练一个算法,通过它从已知的变量来预测未知的变量。

另外一种主要的机器学习方式被叫做非监督式学习unsupervised learning。在非监督式学习中,我们并不尝试预测任何变量。取而代之,在数据中找到一种模式。

一个非常重要的非监督式学习技术叫做聚类。当我们尝试探索一个数据集时,并且准备去理解变量的行与列之间的联系时,我们使用聚类。例如,我们可以基于NBA球员的统计资料,来聚集他们。

这里是他们的聚类分布图:

这个分类组制作出之后,你将很容易发现球员的角色,否则,你很难弄清楚。Here's是一个描述分类组怎样被创建出来的文章。

聚类算法组类似在一起的行。他们在数据中可以是一个或多个一组,并且这些组来自于聚类。当我们看这个分类组,我们可以更好的理解数据的结构。

聚类是探索未知数据的钥匙,它是机器学习中普遍用法。在这个任务中,我们将会研究US国会议员选票的聚类问题。

 

本文转载自:www.dataquest.io

Betty__
粉丝 8
博文 360
码字总数 46678
作品 0
武汉
私信 提问
报名 | 恰到好处的机器学习入门课,一站搞定基础+算法+实战

     每天能留给学习的时间不多,当入门一个新技术的时候,多么希望学到的每一个字都能立马派上用场,所以我们会偏向选择那些可以“速成”但学完依旧没有什么卵用的技能,对于可以提升整...

机器之心
2018/07/17
0
0
关于举办“MATLAB数据分析、图形图像处理与机器学习”培训班通知

关于举办“MATLAB数据分析、图形图像处理与机器学习”培训班通知 各企事业单位、高等院校及科研院所: MATLAB是由美国MathWorks公司推出的一款应用于科学计算和工程仿真的交互式编程软件,它...

sdxx1021
08/20
1
0
关于举办“MATLAB数据分析、图形图像处理与机器学习”培训班

关于举办“MATLAB数据分析、图形图像处理与机器学习”培训班通知 各企事业单位、高等院校及科研院所: MATLAB是由美国MathWorks公司推出的一款应用于科学计算和工程仿真的交互式编程软件,它...

sdxx1021
08/22
2
0
零基础学习机器学习(Python语言、算法、Numpy库、MatplotLib)视频

机器学习作为人工智能的一部分,已经应用于很多领域,远超过人们的想象,垃圾邮件的过滤,在线广告的推荐系统,还有目前发展飞快的物体识别、人脸识别和语音识别的发展,都是机器学习的应用的...

qq_38472149
2018/05/28
0
0
团队拙作《Python机器学习实战》

之前看国内外的 Python 机器学习的书,鲜有将机器学习到底怎么做人脸识别、怎么做风险控制、怎么做 OCR 算法模型列出的,并且真正的一个 Python 应用,不止是从机器学习库中导入一下配置一下...

yijun2018
2018/04/20
0
0

没有更多内容

加载失败,请刷新页面

加载更多

3_数组

3_数组

行者终成事
36分钟前
7
0
经典系统设计面试题解析:如何设计TinyURL(二)

原文链接:https://www.educative.io/courses/grokking-the-system-design-interview/m2ygV4E81AR 编者注:本文以一道经典的系统设计面试题:《如何设计TinyURL》的参考答案和解析为例,帮助...

APEMESH
今天
7
0
使用logstash同步MySQL数据到ES

概述   在生成业务常有将MySQL数据同步到ES的需求,如果需要很高的定制化,往往需要开发同步程序用于处理数据。但没有特殊业务需求,官方提供的logstash就很有优势了。   在使用logstas...

zxiaofan666
今天
10
0
X-MSG-IM-分布式信令跟踪能力

经过一周多的鏖战, X-MSG-IM的分布式信令跟踪能力已基本具备, 特点是: 实时. 只有要RX/TX就会实时产生信令跟踪事件, 先入kafka, 再入influxdb待查. 同时提供实时sub/pub接口. 完备. 可以完整...

dev5
今天
7
0
OpenJDK之CyclicBarrier

OpenJDK8,本人看的是openJDK。以前就看过,只是经常忘记,所以记录下 图1 CyclicBarrier是Doug Lea在JDK1.5中引入的,作用就不详细描述了,主要有如下俩个方法使用: await()方法,如果当前线...

克虏伯
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部