机器学习_读书笔记
博客专区 > skanda 的博客 > 博客详情
机器学习_读书笔记
skanda 发表于3个月前
机器学习_读书笔记
  • 发表于 3个月前
  • 阅读 10
  • 收藏 0
  • 点赞 0
  • 评论 0
摘要: 周志华版,在公司做过若干spark ml库应用后,加强理论支撑。 老大桌上的书,因书中太多数学字符,为提高效率,记录文本部分。

 机器学习过程:根据训练样本得到模型,再用真实数据输入结果得到标记空间(又称输出空间)。一般地,预测任务是希望通过对训练空间((x1,y1),(x2,y2),.....(xn,yn)) 进行学习,建立一个从输入控件X到输出空间Y的映射f:x->y。

 若我们预测的是离散值,此类学习任务被称为“分类”Classification; 若我们预测的是连续值,此类学习任务被称为“回归”regression; =

  我们还可以对西瓜做聚类Clustering,即是对训练集中的西瓜分成若干组,每组成为一个簇,这些自动形成的簇可能对应一些潜在的概念划分。比如浅色瓜,本地瓜。其中浅色瓜和本地瓜这些概念我们是事先不知道的,而且学习过程中使用的训练样本通常不用有标记信息,这样的学习过程有助于我们理解数据内在规律。

   监督学习supervised learning=分类和回归

   无监督学习unsupervised learning=聚类

    对学得模型适用于新样本的能力,成为泛化能力。学习算法自身的归纳偏好与问题是否匹配,往往会对结果起到决定性作用。

  过拟合:学习器把训练训练样本本身一些特点当作了所有潜在样本都会有的一般性质,就是过拟合。

标签: 机器学习
共有 人打赏支持
粉丝 9
博文 75
码字总数 49877
×
skanda
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: