文档章节

Mahout之Taste Webapp实战

一枚Sir
 一枚Sir
发布于 2014/06/23 18:24
字数 502
阅读 140
收藏 6

Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout还支持在Hadoop集群中运行,使这些算法可以更高效的运行在云计算环境中。 
    目前Mahout已经发布的最高版本是0.9。在这里https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout可以找到Mahout的下载路径,可以下载0.9版本的源码压缩包(mahout-distribution-0.9-src.tar.gz),也可以从svn中co主干代码。

后面的介绍都是以0.9版本的源代码包为基础做的介绍。 

前期准备:安装maven(http://my.oschina.net/MrMichael/blog/283125)。

1.下载代码后,解压。

tar -xvf mahout-distribution-0.9-src.tar.gz

 


(暂时此段无用)http://seanhe.iteye.com/blog/1124682

然后命令行进入mahout-distribution-0.9目录执行 

mvn -DskipTests install

将mahout相关模块进行编译,并安装到本地maven仓库中 
如果出现内存溢出,可以先调大JVM的堆内存大小 

export MAVEN_OPTS=-Xmx1024m

注意:此时可能报错。一般这个问题是由于你的网速太慢,maven无法及时获取需要的资源。解决办法就是执行下

 mvn clean+mvn install

清除干净后再装。不过如果你的网络特别差就要想办法了,本人很杯具的遇到这种情况,早上7点趁大家都不用网络时,安装一次成功。

2.生成eclipse工程,本步骤可选,但是建议进行。因为在eclipse中修改java工程代码比较方便。还是在mahout-distribution-0.5目录执行以下命令 

mvn eclipse:eclipse

2.将 movie.dat 和 ratings.dat 拷贝到 Mahout 安装目录下的 /mahout-src0.9/examples/src/main/java/org/apache/mahout/cf/taste/example/grouplens 目录下。

3.回到在 core 目录下,运行"mvn install",将 Mahout core 安装在本地库中。

TODO

 

 

 

 

 

 

 

 

 

 

© 著作权归作者所有

共有 人打赏支持
一枚Sir
粉丝 117
博文 209
码字总数 350904
作品 0
朝阳
架构师
hadoop 推荐引擎资料记录

在hadoop上做推荐系统,主要的开源软件是mahout,不仅实现了基于协同的算法,还实现了很多机器学习算法。很有学习价值。 官网地址:http://mahout.apache.org 简介:http://www.ibm.com/deve...

七水禾
2014/03/24
0
0
Mahout下个性化推荐引擎Taste介绍

Mahout下个性化推荐引擎Taste介绍 Taste是 Apache Mahout 提供的一个个性化推荐引擎的高效实现,该引擎基于java实现,可扩展性强,同时在mahout中对一些推荐算法进行了MapReduce编程模式转化...

yuzh
2012/12/27
0
0
Linux下Mahout安装遇到的问题

Mahout 0.5版本有taste-web,以后版本就没有了。 2. 使用JDK1.7编译Mahout(0.5—0.7)会出现bug,编译不过去。 问题貌似是关于接口的方法没实现的,但是这只是与JDK自带的那个接口重名而已。...

月毁星坠
2013/06/19
0
0
基于 Apache Mahout 构建社会化推荐引擎-实战

参考文章 IBM<>,文章的链接: [http://www.ibm.com/developerworks/cn/java/j-lo-mahout/][1] 安装条件: 1) JDK,使用1.6版本。 MyEclipse /Eclipse 2) Maven,使用2.0.11版本或以上。 3)......

zhayefei
2013/07/04
0
21
实战Mahout聚类算法Canopy+K-means

Mahout是Apache的顶级开源项目,它由Lucene衍生而来,且基于Hadoop的,对处理大规模数据的机器学习的经典算法提供了高效的实现。其中,对经典的聚类算法即提供了单机实现,同时也提供了基于h...

Breath_L
2012/05/20
0
1

没有更多内容

加载失败,请刷新页面

加载更多

通过ajax访问远程天气预报服务

http://www.webxml.com.cn/zh_cn/index.aspx 更改wsdl文件 打开文件将15行,51行,101行去掉 然后把文件复制到c盘 然后在桌面上面就生成了文件 将文件打成jar包 package cn.it.ws.weather;...

江戸川
21分钟前
1
0
聊聊storm的tickTuple

序 本文主要研究一下storm的tickTuple 实例 TickWordCountBolt public class TickWordCountBolt extends BaseBasicBolt { private static final Logger LOGGER = LoggerFactory.getLogg......

go4it
24分钟前
1
0
自动装箱和自动拆箱

自动装箱和自动拆箱 Java 提供了 8 种基本数据类型,每种数据类型都有其对应的包装类型,包装类是面向对象的类,是一种高级的数据类型,可以进行一些比较复杂的操作,它们是引用类型而不再基...

tsmyk0715
44分钟前
2
0
简易审计系统

1、有时候我们需要对线上用户的操作进行记录,可以进行追踪,出现问题追究责任,但是linux自带的history并不会实时的记录(仅仅在内存中,当用户正常退出(exit logout )时才会记录到history文件里...

芬野de博客
49分钟前
2
0
Qt那些事0.0.6

QML中使用Image,在设置source的后,通过Qt Quick2 Preview(qmlscene)遇到了图片找不到的问题: Image { id: success_img anchors.centerIn: parent ...

Ev4n
49分钟前
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部