文档章节

Mahout之Taste Webapp实战

一枚Sir
 一枚Sir
发布于 2014/06/23 18:24
字数 502
阅读 138
收藏 6
点赞 0
评论 0

Apache Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序。经典算法包括聚类、分类、协同过滤、进化编程等等,并且,在 Mahout还支持在Hadoop集群中运行,使这些算法可以更高效的运行在云计算环境中。 
    目前Mahout已经发布的最高版本是0.9。在这里https://cwiki.apache.org/confluence/display/MAHOUT/BuildingMahout可以找到Mahout的下载路径,可以下载0.9版本的源码压缩包(mahout-distribution-0.9-src.tar.gz),也可以从svn中co主干代码。

后面的介绍都是以0.9版本的源代码包为基础做的介绍。 

前期准备:安装maven(http://my.oschina.net/MrMichael/blog/283125)。

1.下载代码后,解压。

tar -xvf mahout-distribution-0.9-src.tar.gz

 


(暂时此段无用)http://seanhe.iteye.com/blog/1124682

然后命令行进入mahout-distribution-0.9目录执行 

mvn -DskipTests install

将mahout相关模块进行编译,并安装到本地maven仓库中 
如果出现内存溢出,可以先调大JVM的堆内存大小 

export MAVEN_OPTS=-Xmx1024m

注意:此时可能报错。一般这个问题是由于你的网速太慢,maven无法及时获取需要的资源。解决办法就是执行下

 mvn clean+mvn install

清除干净后再装。不过如果你的网络特别差就要想办法了,本人很杯具的遇到这种情况,早上7点趁大家都不用网络时,安装一次成功。

2.生成eclipse工程,本步骤可选,但是建议进行。因为在eclipse中修改java工程代码比较方便。还是在mahout-distribution-0.5目录执行以下命令 

mvn eclipse:eclipse

2.将 movie.dat 和 ratings.dat 拷贝到 Mahout 安装目录下的 /mahout-src0.9/examples/src/main/java/org/apache/mahout/cf/taste/example/grouplens 目录下。

3.回到在 core 目录下,运行"mvn install",将 Mahout core 安装在本地库中。

TODO

 

 

 

 

 

 

 

 

 

 

© 著作权归作者所有

共有 人打赏支持
一枚Sir
粉丝 116
博文 207
码字总数 350904
作品 0
朝阳
架构师
mahout in action中文版

mahout in action 中文翻译第1章初识mahout mahout in action 中文翻译 1. 初识Mahout 本章涵盖以下内容: Apache Mahout是什么? 现实中推荐系统引擎、聚类、分类概述 配置mahout 读者可能从...

xiaomin0322 ⋅ 前天 ⋅ 0

Mahout之推荐算法基本实例

Mahout中主要核心的三大算法为推荐,聚类及分类算法,今天就最基本的推荐算法做总结,推荐中常用的两个推荐算法是”userbased”和”itembased”,前者主要通过和你兴趣相似的人来发现新的你感...

xiaomin0322 ⋅ 06/11 ⋅ 0

hadoop mahout:org.apache.classifier.df.mapreduce.TestForest error

我搭了三台CentOS7虚拟机,安装配置好了hadoop-3.0.0,准备运行mahout上的随机森林算法来训练一个机器学习分类器。第一步是生成描述文件(/des.info);第二步是训练森林模型(/user/hadoop/fo...

Balrog_Z ⋅ 05/02 ⋅ 0

云计算学习大纲是什么?怎么学习云计算?

《2018×××Linux云计算架构师+Python运维开发课程》十大阶段的课程为由浅入深、循序渐进的完整课程体系,包括结合Linux的网络基础实战、Linux系统配置及服务深度解析、Shell脚本自动化运维...

长沙千锋 ⋅ 04/28 ⋅ 0

如何用形象的比喻描述大数据的技术生态?Hadoop,Hive,hbase,hdfs、MapReduc

学习很重要的是能将纷繁复杂的信息进行归类和抽象。 对应到大数据技术体系,虽然各种技术百花齐放,层出不穷,但大数据技术本质上无非解决4个核心问题。 1. 存储,海量的数据怎样有效的存储?...

chenhao_asd ⋅ 04/25 ⋅ 0

哈尔滨大数据培训课程哪个好?从内容教你如何判断

导读 随着大数据飞速发展,大数据将对人类生活产生深远影响,大数据是未来科技浪潮发展不容忽视的巨大推动力量,加上人工智能对大数据技术的需要,使越来越多的人想要从事大数据,但却不知道哈...

hxl0009 ⋅ 04/16 ⋅ 0

Mahout推荐算法之SlopOne

一、 算法原理 有别于基于用户的协同过滤和基于item的协同过滤,SlopeOne采用简单的线性模型估计用户对item的评分。如下图,估计UserB对ItemJ的偏好 图(1) 在真实情况下,该方法有如下几个...

xiaomin0322 ⋅ 06/19 ⋅ 0

大数据应用——数据挖掘之推荐系统

数据挖掘——推荐系统 大数据可以认为是许多数据的聚合,数据挖掘是把这些数据的价值发掘出来,比如有过去10年的气象数据,通过数据挖掘,几乎可以预测明天的天气是怎么样的,有较大概率是正...

Alukar ⋅ 06/02 ⋅ 0

SQL Server 2012 AlwaysOn高可用配置之六:启用AlwaysOn功能

6. 启用AlwaysOn功能 6.1 在SQL01打开”SQL Server Configuration Manager”,右键“SQL Server(MSSQLSERVER)”选择”属性” 6.2 在“AlwaysOn高可用性”页面勾选“启用AlwaysOn可用性组”...

余二五 ⋅ 2017/11/08 ⋅ 0

数据分析师的基本素养——论如何成为一名数据科学家 Part 2

更多深度文章,请关注: https://yq.aliyun.com/cloud 本文为《数据分析师的基本素养——论如何成为一名数据科学家》文章的第二部分,第一部分请点击这里。 Pronojit Saha,数据发烧友 数据科...

【方向】 ⋅ 2017/02/17 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

Java序列化和反序列化

1、什么是序列化和反序列化 序列化:把对象转换为字节序列的过程。 反序列化:把字节序列恢复成对象的过程。 2、被序列化的类需要实现serializable接口,只是为了标注该对象是可以被序列化的...

IT-Mamba ⋅ 3分钟前 ⋅ 0

流式构建原理

流式构建需要达到分钟级的数据更新频率,Kylin采用类似于Spark Streaming的做法,每隔数分钟进行一次微构建。这边的构建需要考虑到一个延迟因素,分布式网络存在延迟等因素,该时间段的数据有...

无精疯 ⋅ 4分钟前 ⋅ 0

在maven项目工程编写solr代码,需要的依赖

solrJ <dependency> <groupId>org.apache.solr</groupId> <artifactId>solr-solrj</artifactId> <version>6.6.2</version> </dependency> <dependency> <groupId>org.apache.httpcomponents<......

爱运动的小乌龟 ⋅ 11分钟前 ⋅ 0

Spring Cloud Config

Spring Cloud Config application.yml 和 bootstrap.yml 区别 加载顺序 bootstrap.yml 先加载 application.yml 后加载 bootstrap.yml 用于应用程序上下文的引导阶段。 bootstrap.yml 由父 Sp...

施长成 ⋅ 21分钟前 ⋅ 0

MapReduce V2——YARN调度

一、MapReduce的局限性 1、JobTracker的单点问题 2、TaskTracker的作业信息分配的过于简单,当有资源消耗较大的或者时间较长的Task分配在同一个节点上的时候,容易失败或者等待时间过长 3、作...

cjxcloud ⋅ 22分钟前 ⋅ 0

EOS踩坑--脆弱的数据库

安装EOS我就不在这赘述了,来唠唠EOS踩到的坑,跟着官方文档走,然后到了同步数据的时候,Ctrl+Z结束了之后,再次运行报错 root@ubuntu:~# nodeos -e -p eosio --plugin eosio::chain_api_pl...

开源首席鉴黄师 ⋅ 22分钟前 ⋅ 0

对于程序员的招聘问题,作为软件人的一些吐槽和建议

作为软件人,找工作有时候似乎挺苦逼的。 说真的,让我去掉前面这句中“似乎”二字吧。就是苦逼!很多人都曾抱怨处在招聘的一方很糟糕——我们没有任何可靠的方式来甄别会写代码并且写得好的...

老道士 ⋅ 37分钟前 ⋅ 0

Linux下MySQL表名不区分大小写的设置方法(抄袭别人的)

Linux下MySQL表名不区分大小写的设置方法 MySQL表名不区分大小写的设置方法 在用centox安装mysql后,把项目的数据库移植了过去,发现一些表的数据查不到,排查了一下问题,最后发现是表名的大...

随风而浮沉 ⋅ 46分钟前 ⋅ 0

ubuntu下安装宋体simsun

sudo cp simsun.ttc /usr/share/fonts cd /usr/share/fonts sudo chmod 644 simsun.ttc 更新字体缓存: 代码: sudo mkfontscale 代码: sudo mkfontdir 代码: sudo fc-cache -fsv 安装chrome扩......

wangxuwei ⋅ 48分钟前 ⋅ 0

利用 ssh 传输文件

Linux 下一般可以用 scp 命令通过 ssh 传送文件: #把服务器上的 /home/user/a.txt 发送到本机的 /var/www/local_dir 目录下scp username@servername:/home/user/a.txt /var/www/local_dir...

大灰狼时间 ⋅ 58分钟前 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部