文档章节

Mahout之Taste Webapp实战

一枚Sir
 一枚Sir
发布于 2014/06/23 18:24
字数 502
阅读 156
收藏 6

Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout还支持在Hadoop集群中运行,使这些算法可以更高效的运行在云计算环境中。 
    目前Mahout已经发布的最高版本是0.9。在这里https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout可以找到Mahout的下载路径,可以下载0.9版本的源码压缩包(mahout-distribution-0.9-src.tar.gz),也可以从svn中co主干代码。

后面的介绍都是以0.9版本的源代码包为基础做的介绍。 

前期准备:安装maven(http://my.oschina.net/MrMichael/blog/283125)。

1.下载代码后,解压。

tar -xvf mahout-distribution-0.9-src.tar.gz

 


(暂时此段无用)http://seanhe.iteye.com/blog/1124682

然后命令行进入mahout-distribution-0.9目录执行 

mvn -DskipTests install

将mahout相关模块进行编译,并安装到本地maven仓库中 
如果出现内存溢出,可以先调大JVM的堆内存大小 

export MAVEN_OPTS=-Xmx1024m

注意:此时可能报错。一般这个问题是由于你的网速太慢,maven无法及时获取需要的资源。解决办法就是执行下

 mvn clean+mvn install

清除干净后再装。不过如果你的网络特别差就要想办法了,本人很杯具的遇到这种情况,早上7点趁大家都不用网络时,安装一次成功。

2.生成eclipse工程,本步骤可选,但是建议进行。因为在eclipse中修改java工程代码比较方便。还是在mahout-distribution-0.5目录执行以下命令 

mvn eclipse:eclipse

2.将 movie.dat 和 ratings.dat 拷贝到 Mahout 安装目录下的 /mahout-src0.9/examples/src/main/java/org/apache/mahout/cf/taste/example/grouplens 目录下。

3.回到在 core 目录下,运行"mvn install",将 Mahout core 安装在本地库中。

TODO

 

 

 

 

 

 

 

 

 

 

© 著作权归作者所有

上一篇: mahout 之 Taste
一枚Sir
粉丝 119
博文 209
码字总数 350904
作品 0
朝阳
架构师
私信 提问
hadoop 推荐引擎资料记录

在hadoop上做推荐系统,主要的开源软件是mahout,不仅实现了基于协同的算法,还实现了很多机器学习算法。很有学习价值。 官网地址:http://mahout.apache.org 简介:http://www.ibm.com/deve...

七水禾
2014/03/24
118
0
Mahout下个性化推荐引擎Taste介绍

Mahout下个性化推荐引擎Taste介绍 Taste是 Apache Mahout 提供的一个个性化推荐引擎的高效实现,该引擎基于java实现,可扩展性强,同时在mahout中对一些推荐算法进行了MapReduce编程模式转化...

yuzh
2012/12/27
357
0
Linux下Mahout安装遇到的问题

Mahout 0.5版本有taste-web,以后版本就没有了。 2. 使用JDK1.7编译Mahout(0.5—0.7)会出现bug,编译不过去。 问题貌似是关于接口的方法没实现的,但是这只是与JDK自带的那个接口重名而已。...

月毁星坠
2013/06/19
153
0
基于 Apache Mahout 构建社会化推荐引擎-实战

参考文章 IBM<>,文章的链接: [http://www.ibm.com/developerworks/cn/java/j-lo-mahout/][1] 安装条件: 1) JDK,使用1.6版本。 MyEclipse /Eclipse 2) Maven,使用2.0.11版本或以上。 3)......

zhayefei
2013/07/04
3K
21
Apache Mahout 简介

当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见。人们对机器学习技巧(比如说集群、协作筛选和分 类)的需求前所未有地增长,无论是查...

红薯
2009/10/15
3K
3

没有更多内容

加载失败,请刷新页面

加载更多

JMM内存模型(一)&volatile关键字的可见性

在说这个之前,我想先说一下计算机的内存模型: CPU在执行的时候,肯定要有数据,而数据在内存中放着呢,这里的内存就是计算机的物理内存,刚开始还好,但是随着技术的发展,CPU处理的速度越...

走向人生巅峰的大路
18分钟前
40
0
你对AJAX认知有多少(2)?

接着昨日内容,我们几天继续探讨ajax的相关知识点 提到ajax下面几个问题又是必须要了解的啦~~~ 8、在浏览器端如何得到服务器端响应的XML数据。 通过XMLHttpRequest对象的responseXMl属性 9、 ...

理性思考
28分钟前
4
0
正则表达式基础(一)

1.转义 转义的作用: 当某个字符在表达式中具有特殊含义,例如字符串引号中出现了引号,为了可以使用这些字符本身,而不是使用其在表达式中的特殊含义,则需要通过转义符“\”来构建该字符转...

清自以敬
30分钟前
4
0
idea中@Data标签getset不起作用

背景:换电脑以后在idea中有@data注解都不生效 解决办法:idea装个插件 https://blog.csdn.net/seapeak007/article/details/72911529...

栾小糖
36分钟前
4
0
Apache Kudu 不能删除不存在的数据

使用Apache Kudu客户端,对KafkaConnect Sink 进行扩展。 使用的Apache Kudu 的Java 客户端。突然有天发现作业无法提交,一直报错。 后来才发现这是Kudu自身的一种校验机制。为了忽略这种校验...

吐槽的达达仔
46分钟前
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部