对机器学习感兴趣的朋友 或者正在学习的朋友们 希望大家资源共享 一起进步
这里推荐一个我正在看的视频课程: http://open.163.com/special/opencourse/machinelearning.html
机器学习简而言之: 是把无序的数据转换成有用的信息。
机器学习的任务是 分类
测试训练效果:训练数据和测试数据
选择算法:
从目的出发:
1 预测目标变量的值【预测明天下雨的概率】 选择监督学习算法:
1.1 目标变量是离散型 选择分类器算法
目标变量是连续型 选择回归算法
2 不想预测目标的值【对投票者按兴趣分组】 无监督学习算法
2.1 将数据划分为离散组 聚类算法
估计数据和每个分组的相似度 密度估计算法
通用步骤:
1 收集数据
2 准备输入数据 【归一化数值:new_value=(old_value-min)/(max-min) 值为0到1】
3 分析输入数据
4 训练算法
5 测试算法
6 使用算法
k-近邻算法:
1 计算当前节点到每个节点的距离
2 按距离从小到大排序
3 选出K个点
4 计算K个点出现的频率
5 返回出现频率最高的作为预测类别