文档章节

机器学习系列一:机器学习介绍

听风的小猪
 听风的小猪
发布于 2017/03/15 14:43
字数 1010
阅读 257
收藏 7

一、基本介绍

由于最近的研究方向变为机器学习,所以零零星星的看了一些机器学习的介绍,但是一直看的都比较迷糊。为了督促自己,特此写个机器学习的系列。希望学完后,能达到下面的目标:

  • 理解机器学习中的基本概念
  • 理解机器学习中的原理及常用算法
  • 对普通原始数据集进行机器学习前的预处理
  • 使用python语言及其机器学习相关package(如scikit-learn等)
  • 能够根据已掌握的机器学习算法以及应用框架来通过分类以及回归等解决实际问题
  • 为开发机器学习相关的应用打下必要的基础

####1. 机器学习 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

学习:针对经验E(experience)和一系列的任务T(tasks)和一定表现的衡量P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力。

例子: 下棋、语音识别、自动驾驶等。

2.深度学习

概念:深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。

应用展示:无人驾驶汽车中的路标识别、Google now中的语音识别、百度识图、针对图片自动生成文字的描述。

二、基本概念

1、概念学习:人类学习概念:鸟、车

定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。

2、例子:学习“享受运动”这一概念:

小明进行水上运动,是否享受运动取决于很多因素。

样例 | 天气|温度 | 湿度 | 风力 | 水温| 预报 | 享受运动 ----|------|----|----|---- | 1| 晴| 暖|普通| 强|暖|一样|是 2 | 晴|暖|大|强|暖|一样|是 3|雨|冷|大|强|暖|变化|否 4|晴|暖|大|强|冷|变化|是

概念定义在实例(instance)集合之上,这个集合表示X。(X:所有可能的日子,每个日子的值由天气、温度、湿度、风力、水温、预报6个属性表示) 待学习的概念或目标函数成为目标概念,记做c。

c(x)=1时,享受运动,c(x)=0,不享受运动。c(x)也可叫做y。

x:每一个实例

X:样例,所有实例的集合

  1. 训练集:用来进行训练,也就是产生模型或者算法的数据集。
  2. 测试集:用来专门进行测试已经学习好的模型或者算法的数据集。
  3. 特征向量:属性的集合,通常用一个向量来表示,附属于一个集合。
  4. 标记:实例类别的标记。
  5. 分类:目标标记为类别型数据
  6. 回归:目标标记为连续性数值
  7. 例子:研究肿瘤良性、恶性与尺寸、颜色的关系

特征值:肿瘤尺寸、颜色 标记:良性或恶性

有监督学习:训练集有类别标记

无监督学习:无类别标记

半监督学习:有类别标记的训练集+无类别标记的训练集

机器学习步骤框架

  1. 把数据拆分为训练集和测试集。
  2. 用训练集和训练集的特征向量来训练算法。
  3. 用学习来的算法运用在测试集上来评估算法,用验证集。

© 著作权归作者所有

听风的小猪

听风的小猪

粉丝 81
博文 39
码字总数 35907
作品 0
黄浦
程序员
私信 提问
SLS机器学习最佳实战:批量时序异常检测

0.文章系列链接 SLS机器学习介绍(01):时序统计建模 SLS机器学习介绍(02):时序聚类建模 SLS机器学习介绍(03):时序异常检测建模 SLS机器学习介绍(04):规则模式挖掘 SLS机器学习介绍...

悟冥
06/29
0
0
机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)

上一篇机器学习入门系列(1)--机器学习概览简单介绍了机器学习的一些基本概念,包括定义、优缺点、机器学习任务的划分等等。 接下来计划通过几篇文章来介绍下,一个完整的机器学习项目的实现...

材才才
01/26
0
0
#Apache Spark系列技术直播# 第四讲 【 机器学习介绍与Spark MLlib实践 】

Apache Spark系列技术直播--第四讲 机器学习介绍与Spark MLlib实践 直播时间:2018.12.06 19:00 - 20:00 主讲人:江宇(燕回) 阿里巴巴计算平台EMR技术专家 内容提要:本次讲座主要面对的是机...

spark小能手
2018/12/06
0
0
机器学习中的数学:一份新鲜出炉的热门草稿

来源:机器之心; 本文约1500字,建议阅读5分钟。 本文为你分享近日《Mathematics for Machine Learning》的全部草稿已放出,我们整理了这本书的简要概述。 近日,Marc Peter Deisenroth、A...

数据分析v
2018/11/08
0
0
微软推出 Python 免费在线教程视频

我们上次报道过,微软官方上线 Python 教程文档。最近微软针对 Python 初学者,推出了一套免费的教程视频。 这套视频名为 Python for Beginners,由微软高级项目经理 Christopher Harrison、...

afterer
09/21
12K
14

没有更多内容

加载失败,请刷新页面

加载更多

3_数组

3_数组

行者终成事
今天
7
0
经典系统设计面试题解析:如何设计TinyURL(二)

原文链接:https://www.educative.io/courses/grokking-the-system-design-interview/m2ygV4E81AR 编者注:本文以一道经典的系统设计面试题:《如何设计TinyURL》的参考答案和解析为例,帮助...

APEMESH
今天
7
0
使用logstash同步MySQL数据到ES

概述   在生成业务常有将MySQL数据同步到ES的需求,如果需要很高的定制化,往往需要开发同步程序用于处理数据。但没有特殊业务需求,官方提供的logstash就很有优势了。   在使用logstas...

zxiaofan666
今天
10
0
X-MSG-IM-分布式信令跟踪能力

经过一周多的鏖战, X-MSG-IM的分布式信令跟踪能力已基本具备, 特点是: 实时. 只有要RX/TX就会实时产生信令跟踪事件, 先入kafka, 再入influxdb待查. 同时提供实时sub/pub接口. 完备. 可以完整...

dev5
今天
7
0
OpenJDK之CyclicBarrier

OpenJDK8,本人看的是openJDK。以前就看过,只是经常忘记,所以记录下 图1 CyclicBarrier是Doug Lea在JDK1.5中引入的,作用就不详细描述了,主要有如下俩个方法使用: await()方法,如果当前线...

克虏伯
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部