mahout 算法集

原创
2014/01/23 10:14
阅读数 831

本人博客开始迁移,博客整个架构自己搭建及编码http://www.cookqq.com/listBlog.action

算法类

算法名

中文名

分类算法

Logistic Regression

逻辑回归

                            Bayesian

贝叶斯


SVM

支持向量机


Perceptron

感知器算法


Neural Network

神经网络


Random Forests

随机森林


Restricted Boltzmann Machines

有限波尔兹曼机


聚类算法

Canopy Clustering

Canopy聚类

K-means Clustering

K均值算法


Fuzzy K-means

模糊K均值


Expectation Maximization

EM聚类(期望最大化聚类)


Mean Shift Clustering

均值漂移聚类


Hierarchical Clustering

层次聚类


Dirichlet Process Clustering

狄里克雷过程聚类


Latent Dirichlet Allocation

LDA聚类


Spectral Clustering

谱聚类


关联规则挖掘

Parallel FP Growth Algorithm

并行FP Growth算法

回归

Locally Weighted Linear Regression

局部加权线性回归

降维/维约简

Singular Value Decomposition

奇异值分解

Principal Components Analysis

主成分分析


Independent Component Analysis

独立成分分析


Gaussian Discriminative Analysis

高斯判别分析


进化算法

并行化了Watchmaker框架

 

推荐/协同过滤

Non-distributed recommenders

Taste(UserCF, ItemCF, SlopeOne)

Distributed Recommenders

ItemCF


向量相似度计算

RowSimilarityJob

计算列间相似度

VectorDistanceJob

计算向量间距离


非Map-Reduce算法

Hidden Markov Models

隐马尔科夫模型

集合方法扩展

Collections

扩展了java的Collections类




Mahout的常用聚类算法

Algorithms

In-memory implementation

MapReduce implementation

Fixed clusters

Partial membership

K-Means

KMeansClusterer

KMeansDriver

Y

N

Canopy

CanopyClusterer

CanopyDriver

N

N

Fuzzy K-Means

FuzzyKMeansClusterer

FuzzyKMeansDriver

Y

Y

Dirichlet

DirichletClusterer

DirichletDriver

N

Y

LDA

N/A

LDADriver

Y

Y



展开阅读全文
打赏
0
5 收藏
分享
加载中
更多评论
打赏
0 评论
5 收藏
0
分享
返回顶部
顶部