文档章节

mahout 算法集

cookqq
 cookqq
发布于 2014/01/23 10:14
字数 347
阅读 796
收藏 5

本人博客开始迁移,博客整个架构自己搭建及编码http://www.cookqq.com/listBlog.action

算法类

算法名

中文名

分类算法

Logistic Regression

逻辑回归

                            Bayesian

贝叶斯


SVM

支持向量机


Perceptron

感知器算法


Neural Network

神经网络


Random Forests

随机森林


Restricted Boltzmann Machines

有限波尔兹曼机


聚类算法

Canopy Clustering

Canopy聚类

K-means Clustering

K均值算法


Fuzzy K-means

模糊K均值


Expectation Maximization

EM聚类(期望最大化聚类)


Mean Shift Clustering

均值漂移聚类


Hierarchical Clustering

层次聚类


Dirichlet Process Clustering

狄里克雷过程聚类


Latent Dirichlet Allocation

LDA聚类


Spectral Clustering

谱聚类


关联规则挖掘

Parallel FP Growth Algorithm

并行FP Growth算法

回归

Locally Weighted Linear Regression

局部加权线性回归

降维/维约简

Singular Value Decomposition

奇异值分解

Principal Components Analysis

主成分分析


Independent Component Analysis

独立成分分析


Gaussian Discriminative Analysis

高斯判别分析


进化算法

并行化了Watchmaker框架

 

推荐/协同过滤

Non-distributed recommenders

Taste(UserCF, ItemCF, SlopeOne)

Distributed Recommenders

ItemCF


向量相似度计算

RowSimilarityJob

计算列间相似度

VectorDistanceJob

计算向量间距离


非Map-Reduce算法

Hidden Markov Models

隐马尔科夫模型

集合方法扩展

Collections

扩展了java的Collections类




Mahout的常用聚类算法

Algorithms

In-memory implementation

MapReduce implementation

Fixed clusters

Partial membership

K-Means

KMeansClusterer

KMeansDriver

Y

N

Canopy

CanopyClusterer

CanopyDriver

N

N

Fuzzy K-Means

FuzzyKMeansClusterer

FuzzyKMeansDriver

Y

Y

Dirichlet

DirichletClusterer

DirichletDriver

N

Y

LDA

N/A

LDADriver

Y

Y



© 著作权归作者所有

cookqq

cookqq

粉丝 120
博文 268
码字总数 156096
作品 0
海淀
技术主管
私信 提问
Apache Mahout:适合所有人的可扩展机器学习框架

在软件的世界中,两年就像是无比漫长的时光。在过去两年中,我们看到了社交媒体的风生水起、大规模集群计算的商业化(归功于 Amazon 和 RackSpace 这样的参与者),也看到了数据的迅猛增长以...

龙鸟
2012/07/11
1K
0
Apache Mahout 0.8 发布,机器学习库

Apache Mahout 0.8 发布了,Apache Mahout 是 Apache Software Foundation (ASF) 开发的一个全新的开源项目,其主要目标是创建一些可伸缩的机器学习算法,供开发人员在 Apache 在许可下免费使...

oschina
2013/07/26
2.9K
1
从源代码剖析Mahout推荐引擎

从源代码剖析Mahout推荐引擎 Hadoop家族系列文章, 主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,...

片刻
2014/06/19
449
0
Mahout之Taste Webapp实战

Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚...

一枚Sir
2014/06/23
155
0
Apache Mahout 0.11.1 发布,机器学习库

Apache Mahout PMC 发布了 Mahout 0.11.1 版本,现已提供下载: http://www.apache.org/dist/mahout/0.11.1/ Mahout 0.11.0 扩展了与 Spark 版本的兼容性,引入了一些新特性和 bug 修复。 Ma...

oschina
2015/11/08
1K
0

没有更多内容

加载失败,请刷新页面

加载更多

为什么要在网站中应用CDN加速?

1. 网页加载速度更快 在网站中使用CDN技术最直接的一个好处就是它可以加快网页的加载速度。首先,CDN加速的内容分发是基于服务器缓存的,由于CDN中缓存了不少数据,它能够给用户提供更快的页...

云漫网络Ruan
27分钟前
4
0
亚玛芬体育(Amer Sports)和信必优正式启动合作开发Movesense创新

亚玛芬体育和信必优正式启动合作开发Movesense创新,作为亚玛芬体育的完美技术搭档,信必优利用Movesense传感器技术为第三方开发移动应用和服务。 Movesense基于传感器技术和开放的API,测量...

symbiochina88
38分钟前
2
0
创龙TI AM437x ARM Cortex-A9 + Xilinx Spartan-6 FPGA核心板规格书

SOM-TL437xF是一款广州创龙基于TI AM437x ARM Cortex-A9 + Xilinx Spartan-6 FPGA芯片设计的核心板,采用沉金无铅工艺的10层板设计,适用于高速数据采集和处理系统、汽车导航、工业自动化等领...

Tronlong创龙
38分钟前
3
0
好程序员Java学习路线分享MyBatis之线程优化

  好程序员Java学习路线分享MyBatis之线程优化,我们的项目存在大量用户同时访问的情况,那么就会出现大量线程并发访问数据库,这样会带来线程同步问题,本章我们将讨论MyBatis的线程同步问...

好程序员官方
44分钟前
6
0
IDEA 自定义方法注解模板

IDEA 自定义方法注解模板 1、使用效果 /*** 计算交易费用* @Author wangjiafang* @Date 2019/9/11* @param feeComputeVo* @return*/@PostMapping("/v1/fee_compute")public ApiResp......

小白的成长
44分钟前
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部