加载中
Hive技术文档

Hive是什么? Hive是蜂房的意思,为什么hadoop上的这层数据仓库叫Hive? 因为生物学上蜂房是一个结构相当精良的建筑,取名Hive足见则个数据仓库在数据存储上也是堪称精良的。Hive是Facebook开...

2015/08/06 19:37
397
HIVE与mysql的关系

Hive是一个基于Hadoop的数据仓库平台。通过hive,我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言:HQL,能 够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。 ...

2015/04/22 17:45
3.2K
Hadoop1.0.4+Hbase0.94+zookeeper3.4.5+phoenix3.1.0

1. JDK安装 JDK解压配置环境变量 vi /etc/profile 2. 每台机器相关设置 1.设置静态ip(便于机器之间的通信,防止路由器电脑重启后,ip变化,导致不能通信) vim /etc/sysconfig/network-scr...

2015/05/06 15:04
711
初识Hadoop

要对Hadoop整体有一个概念,是解决什么问题的要有一个认识。 当一头牛拉不动一根木头的时候,为了解决这个问题,我们不会去培育更强更壮的牛。同样,我们也不需要尝试开发超级计算机,而应该...

2015/03/24 11:58
384
Hive操作语句的使用

#创建表人信息表 person(String name,int age) hive> create table person(name STRING,age INT)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' ESCAPED BY '\\' STORED AS TEXTFILE; OK ...

2015/08/06 19:05
91
hadoop异常记录

下面遇到问题,提供了一些解决办法,希望有所帮助 1:Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out 这是reduce预处理阶段shuffle时获取已完成的map的输出失败次数超过上...

2015/05/16 11:42
390
sqoop数据迁移

1.Sqoop1与Sqoop2的优缺点 比较 Sqoop1 Sqoop2 架构 仅仅使用一个Sqoop客户端 引入了Sqoop server集中化管理connector,以及rest api,web,UI,并引入权限安全机制 部署 部署简单,安装需要...

2015/04/22 11:47
696
hive配置参数说明

hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) 默认值:true hive.exec.mode.local.auto.inputbytes.max 如果hive.exec.mode.local.au...

2015/04/22 17:44
100
Apache Spark 的设计与实现(job逻辑执行图)

Job 逻辑执行图 General logical plan 典型的 Job 逻辑执行图如上所示,经过下面四个步骤可以得到最终执行结果: 从数据源(可以是本地 file,内存数据结构, HDFS,HBase 等)读取数据创建最...

2016/09/21 16:27
361

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部