加载中
机器学习总览与场景使用大全

机器学习分类,算法比较,使用场景

LightGBM 算法原理

LightGBM 的动机 GBDT (Gradient Boosting Decision Tree) 是机器学习中一个长盛不衰的模型,其主要思想是利用弱分类器(决策树)迭代训练以得到最优模型,该模型具有训练效果好、不易过拟合...

2019/04/23 14:21
2K
XGBoost原理——机器学习大杀器

XGBoost是什么 Boosting算法的思想是将许多弱分类器集成在一起形成一个强分类器。因为XGBoost是一种提升树模型,所以它是将许多树模型集成在一起,形成一个很强的分类器。 在决策树中,我们知...

2019/04/23 10:36
226
spark mllib 基于卡方校验的特征选择

卡方校验: 在分类资料统计推断中一般用于检验一个样本是否符合预期的一个分布. 是统计样本的实际值与理论推断值之间的偏离程度. 卡方值越小,越趋于符合

spark mllib TF-IDF 文本特征提取算法

TF-IDF 是一种简单的文本特征提取算法

spark mllib 数据降维 主成分分析(PCA)

主成分分析PCA:设法将原来具有一定相关行(比如 P个指标)的指标 重新组合成一组新的互相无关的综合指标来代替原来的指标,从而实现数据降维的目的

spark mllib 数据降维 奇异值分解(SVD)

奇异值分解(SVD):一个矩阵分解成带有方向向量的矩阵相乘

spark mllib FP树 FP-growth 关联关系 挖掘算法

Apriori算法基础上改进的关联关系挖掘算法 FP-growth

spark mllib 聚类 快速迭代

基本原理:使用含有权重的无向线将样本数据连接在一张无向图中,之后按照相似度划分, 使得划分后的子图内部具有最大的相似度二不同的子图具有最小的相似度从而达到聚类的效果. 数据源要求 ...

spark mlilib 聚类 混合高斯

高斯分布:当一个数据向量在一个高斯分布的模型计算与之以内,则认为它与高斯分布相匹配,属于此模型的聚类. 混合高斯分布:任何样本的聚类都可以使用多个单高斯分布模型来表示.主要解决单...

spark mlilib 聚类 KMeans

一般来说,回归即是预测,分类是指有监督的学习,即要分类的样本是有标记的,类别是已知的; 聚类是指无监督的学习,样本没有标记,根据某种相似度度量,将样本聚为 K类

spark mllib 随机森林算法

spark mllib 随机森林算法是机器学习、

spark mllib 决策树 DT

决策树是一种监督学习,分类的一种. 决策树使用案例-出去玩

spark mllib 朴素贝叶斯 应用案例

朴素贝叶斯,可应用于垃圾邮件,短信的分类僵尸粉的鉴定等.下面以僵尸粉的鉴定为例

spark mllib 朴素贝叶斯 naive bayes

spark mllib朴素贝叶斯 naive bayes 分类例子

spark mllib 分类之支持向量机

spark mllib 支持向量机 胃癌转移判断案例

spark mllib 分类预测之逻辑回归

胃癌转移数据说明 肾细胞癌转移情况(有转移 y=1,无转移 y=2) x1:确诊时患者年龄(岁) x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级 x3:肾细胞癌组织内微血管数(MVC) x4:...

2016/07/28 19:22
2.5K
spark mllib 预测之LinearRegression(线性回归)

spark mllib LinearRegression(线性回归), 商品价格与消费者输入之间的关系

spark mllib 随机梯度下降 SGD

随机梯度下降法(stochastic gradient descent,SGD) SGD是最速梯度下降法的变种。 使用最速梯度下降法,将进行N次迭代,直到目标函数收敛,或者到达某个既定的收敛界限。 每次迭代都将对m...

spark mllib 协同过滤算法,基于 (交替最小二乘法) ALS 计算

机器学习部分的运行环境 idea15 + spark-assembly-1.6.1-hadoop2.6.0.jar + scala-sdk-2.10.5 + jdk1.8 基于用户对物品的点评,利用spark mllib的协同过滤算法之ALS,为用户推荐商品...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部