加载中
Data Mining Methods for Recommender Systems推荐读书笔记

1.简介 推荐系统使用的数据挖掘技术,包括3个部分,数据预处理、数据分析、结果可解释 2.数据预处理 数据定义为对象及其属性的集合,属性是指对象所表达的特征。现实的数据需要进行预处理(清...

2014/05/20 16:12
58
hive资源索引

hive SQL优化之distribute by和sort by http://blog.sina.com.cn/s/blog_4d3a41f4010139xu.html hive 排序特性研究 http://blog.csdn.net/ls3648098/article/details/9786197 Hadoop Hive s...

2014/05/14 11:52
17
hadoop 推荐引擎资料记录

在hadoop上做推荐系统,主要的开源软件是mahout,不仅实现了基于协同的算法,还实现了很多机器学习算法。很有学习价值。 官网地址:http://mahout.apache.org 简介:http://www.ibm.com/deve...

2014/03/24 11:35
118
hadoop下Illegal partition for问题处理

1.背景: 对一个文件中的key进行过滤,需要过滤的key存储在另一个文件中。需要过滤的key数量很大,有上亿条,因此采用bloomfilter等方法不太合适。同时文件中的带过滤的key可能会很多也可能很...

2014/03/11 12:56
126
Collaborative filtering with GraphChi

原帖地址 http://blog.csdn.net/lzt1983/article/details/7913420 原文链接:Collaborative filtering with GraphChi 本文是GraphChi平台的协同过滤工具箱的快速指南。到目前为止,已经支持A...

2014/03/03 13:37
479
hadoop学习中使用到的相关资料汇总

学习使用hadoop来开发 mapreduce二次排序 :需要按照value中的字段来排序,一个典型的场景是value中的数据属于多个类别,map阶段可以标示,但是无序。二次排序之后,value可以在进入reduce的...

2014/02/27 10:14
66

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部