加载中
HBase 原理、设计与优化实践

1、HBase 简介 HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,从问世之初,就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存储提供可靠的方案。从...

2015/12/12 04:55
5.5K
HBase 写优化之 BulkLoad 实现数据快速入库

1、为何要 BulkLoad 导入?传统的 HTableOutputFormat 写 HBase 有什么问题? 我们先看下 HBase 的写流程: 通常 MapReduce 在写HBase时使用的是 TableOutputFormat 方式,在reduce中直接生成...

2013/12/25 00:16
1.3W
HBase Increment(计数器)简介及性能测试

在 HBase: The Definitive Guide 中, Lars George 介绍了 HBase 的一个新特性 Counter Increment,即把一个 column 当作 一个 counter,这样便于给某些在线应用提供实时统计功能。(PS:比如...

2013/10/29 00:15
1.2W
Hadoop Mapper 阶段将数据直接从 HDFS 导入 Hbase

数据源格式如下: 20130512  1  -1  -1  13802  1  2013-05-12 07:26:22   20130512  1  -1  -1  13802  1  2013-05-12 11:18:24 我们期待的结果是数据直接从 hdfs 读取后 写入 hbase,没有 reduce 阶段,...

2013/05/14 03:22
4.8K
分分钟了解 HBase 基本概念和架构

一、概述 Apache HBase 是基于 Hadoop 构建的一个分布式的、可伸缩的海量数据存储系统。常被用来存放一些海量的(通常在TB级别以上)、结构比较简单的数据,如历史订单记录,日志数据,监控 Me...

2013/02/11 01:52
2.6K
HBase性能调优

配置优化 zookeeper.session.timeout 默认值:3分钟(180000ms) 说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServer会被Zookeeper从RS集群清单中移除,HMaster...

2012/12/23 15:53
2.9K
HBase性能优化方法总结

本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考:淘宝Ken Wu同学的博客。 1. 表的设计 1.1 Pre-Cr...

2012/11/29 00:12
2.8K
一条数据的HBase之旅,简明HBase入门教程

1、一条数据的HBase之旅,简明HBase入门教程-开篇 http://www.nosqlnotes.com/technotes/hbase/hbase-overview-concepts/ 2、一条数据的HBase之旅,简明HBase入门教程-Write全流程 http://w...

2012/11/28 23:51
1.8K
HBase 伪分布式安装教程

If you have successfully configured Hadoop on a single machine in pseudo-distributed mode and looking for some help to use Hbase on top of that then you may find this writeup us...

2012/11/26 14:55
3.9K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部