加载中
006.hive语句优化

参考地址:http://www.cnblogs.com/end/archive/2013/01/15/2861448.html hive玩得好不好,在于你对mapreduce理解深不深叻;当然借鉴学习也很重要 倾斜分成group by造成的倾斜和join造成的倾...

2016/05/04 20:14
158
007.hive调优:大数据倾斜

QQ:529815144 QQ群:248087140

2014/01/17 16:09
574
006.面试:HIVE 2个大表join的倾斜问题

1.hive 2个大文件倾斜join如何解决? 设置maxSize和preRedecer的大小,能保证数据的均匀分配。  注意: 设置Reduce和perReducer就行,性能还不错 MAP阶段优化 •mapred.map.tasks 无效 •n...

2016/05/09 00:38
1.5K
Hive运维 — hive-site文件

QQ:529815144 || QQ群:248087140

004.线性表1-2

@author: 小甲鱼 @location: http://study.163.com/course/courseLearn.htm?courseId=468002#/learn/video?lessonId=598013&courseId=468002  1.线性表的定义 只需要记住前面一个人是谁就行...

2016/05/27 14:40
20
hive介绍

QQ:529815144 QQ群:248087140

2014/01/13 19:08
313
[干货]如何构建用户画像

[干货]如何构建用户画像

01.数据结构和算法绪论

@author: 小甲鱼 @location: http://study.163.com/course/courseLearn.htm?courseId=468002#/learn/video?lessonId=598010&courseId=468002  1.相关介绍 什么是数据结构? 数据结构是一门...

2016/05/23 17:01
45
hive-0.12安装详解

群号:214293307

2014/01/13 19:13
3.6K
001.hive数据仓库介绍和应用场景

1.基本概念: 数据仓库是: 一个面向主题、集成的、时变的、非易失的数据集合;支持管理者的决策过程 2.应用场景 1.海量的数据存储 2.ETL (数据分层:将底层概念映射到更一般的较高层概念->多...

2016/05/09 00:09
249
002.hive数据仓库建模和元数据备份

1.数据建模 装逼的解释: 是指 对现实世界各类数据的抽象组合,确定数据库需管辖的范围、数据的组织形式等直至转化成现实的数据库。 通俗的说: 1.概念建模阶段: 就是对业务的梳理和理解(1....

2016/05/05 19:38
306
Spark 是什么?

QQ:529815144 || QQ群:248087140

2015/12/13 14:38
59
新手指导:MapReduce中的分区方法Partitioner

hive调优注意:map的hash的key 和 设置reduce的数量,决定partitions的数量,同时决定最后产生的文件数,求余噢~

从源代码剖析Mahout推荐引擎

QQ:529815144 QQ群:248087140

2014/06/19 21:00
962
各种语言数据类型大小

QQ:529815144 || QQ群:248087140

2015/12/15 18:33
56

没有更多内容

加载失败,请刷新页面

返回顶部
顶部