机器学习系列一:机器学习介绍

原创
2017/03/15 14:43
阅读数 624

一、基本介绍

由于最近的研究方向变为机器学习,所以零零星星的看了一些机器学习的介绍,但是一直看的都比较迷糊。为了督促自己,特此写个机器学习的系列。希望学完后,能达到下面的目标:

  • 理解机器学习中的基本概念
  • 理解机器学习中的原理及常用算法
  • 对普通原始数据集进行机器学习前的预处理
  • 使用python语言及其机器学习相关package(如scikit-learn等)
  • 能够根据已掌握的机器学习算法以及应用框架来通过分类以及回归等解决实际问题
  • 为开发机器学习相关的应用打下必要的基础

####1. 机器学习 概念:多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

学习:针对经验E(experience)和一系列的任务T(tasks)和一定表现的衡量P,如果随之经验E的积累,针对定义好的任务T可以提高表现P,就说计算机具有学习能力。

例子: 下棋、语音识别、自动驾驶等。

2.深度学习

概念:深度学习是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法。

应用展示:无人驾驶汽车中的路标识别、Google now中的语音识别、百度识图、针对图片自动生成文字的描述。

二、基本概念

1、概念学习:人类学习概念:鸟、车

定义:概念学习是指从有关某个布尔函数的输入输出训练样例中推断出该布尔函数。

2、例子:学习“享受运动”这一概念:

小明进行水上运动,是否享受运动取决于很多因素。

样例 | 天气|温度 | 湿度 | 风力 | 水温| 预报 | 享受运动 ----|------|----|----|---- | 1| 晴| 暖|普通| 强|暖|一样|是 2 | 晴|暖|大|强|暖|一样|是 3|雨|冷|大|强|暖|变化|否 4|晴|暖|大|强|冷|变化|是

概念定义在实例(instance)集合之上,这个集合表示X。(X:所有可能的日子,每个日子的值由天气、温度、湿度、风力、水温、预报6个属性表示) 待学习的概念或目标函数成为目标概念,记做c。

c(x)=1时,享受运动,c(x)=0,不享受运动。c(x)也可叫做y。

x:每一个实例

X:样例,所有实例的集合

  1. 训练集:用来进行训练,也就是产生模型或者算法的数据集。
  2. 测试集:用来专门进行测试已经学习好的模型或者算法的数据集。
  3. 特征向量:属性的集合,通常用一个向量来表示,附属于一个集合。
  4. 标记:实例类别的标记。
  5. 分类:目标标记为类别型数据
  6. 回归:目标标记为连续性数值
  7. 例子:研究肿瘤良性、恶性与尺寸、颜色的关系

特征值:肿瘤尺寸、颜色 标记:良性或恶性

有监督学习:训练集有类别标记

无监督学习:无类别标记

半监督学习:有类别标记的训练集+无类别标记的训练集

机器学习步骤框架

  1. 把数据拆分为训练集和测试集。
  2. 用训练集和训练集的特征向量来训练算法。
  3. 用学习来的算法运用在测试集上来评估算法,用验证集。
展开阅读全文
打赏
1
7 收藏
分享
加载中
更多评论
打赏
0 评论
7 收藏
1
分享
返回顶部
顶部