加载中
Hive 安装及使用攻略

前言 Hive是Hadoop一个程序接口,Hive让数据分析人员快速上手,Hive使用了类SQL的语法,Hive让JAVA的世界变得简单而轻巧,Hive让Hadoop普及到了程序员以外的人。 从Hive开始,让分析师们也能...

2014/09/22 16:38
31
Hadoop平台下面实现PageRank算法

这里我们在hadoop平台下面实现Pagerank算法 输入文件格式如下: 1 1.0 2 3 4 5 6 7 8 2 2.0 3 4 5 6 7 8 3 3.0 4 5 6 7 8 4 4.0 5 6 7 8 5 5.0 6 7 8 6 6.0 7 8 7 7.0 8 8 8.0 1 2 3 4 5 6 ...

2014/09/22 16:38
143
Hive中的分区和桶

hive中的分区和桶 Hive 把表组织成“分区” Partition。 这是一种根据“分区列”(Partition column,如日期)的值对表进行粗略划分的机制,使用分区可以加快数据分片(Slice)的查询速度 表...

2014/09/22 16:38
281
从MaxTemperature程序来看Mapreduce 的执行过程

这是一个文档上面内容,相信大家看过《Hadoop权威指南》的应该很熟悉了,介绍hadoop分析数据使用的就是这个列子。 1、Map-Reduce的逻辑过程 假设我们需要处理一批有关天气的数据,其格式如下...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部