加载中
HBase 原理、设计与优化实践

1、HBase 简介 HBase —— Hadoop Database的简称,Google BigTable的另一种开源实现方式,从问世之初,就为了解决用大量廉价的机器高速存取海量数据、实现数据分布式存储提供可靠的方案。从...

2015/12/12 04:55
4.4K
HBase 写优化之 BulkLoad 实现数据快速入库

1、为何要 BulkLoad 导入?传统的 HTableOutputFormat 写 HBase 有什么问题? 我们先看下 HBase 的写流程: 通常 MapReduce 在写HBase时使用的是 TableOutputFormat 方式,在reduce中直接生成...

2013/12/25 00:16
1W
HBase Increment(计数器)简介及性能测试

在 HBase: The Definitive Guide 中, Lars George 介绍了 HBase 的一个新特性 Counter Increment,即把一个 column 当作 一个 counter,这样便于给某些在线应用提供实时统计功能。(PS:比如...

2013/10/29 00:15
9.1K
Hadoop Mapper 阶段将数据直接从 HDFS 导入 Hbase

数据源格式如下: 20130512  1  -1  -1  13802  1  2013-05-12 07:26:22   20130512  1  -1  -1  13802  1  2013-05-12 11:18:24 我们期待的结果是数据直接从 hdfs 读取后 写入 hbase,没有 reduce 阶段,...

2013/05/14 03:22
3.9K
分分钟了解 HBase 基本概念和架构

一、概述 Apache HBase 是基于 Hadoop 构建的一个分布式的、可伸缩的海量数据存储系统。常被用来存放一些海量的(通常在TB级别以上)、结构比较简单的数据,如历史订单记录,日志数据,监控 Me...

2013/02/11 01:52
1.8K
HBase性能调优

配置优化 zookeeper.session.timeout 默认值:3分钟(180000ms) 说明:RegionServer与Zookeeper间的连接超时时间。当超时时间到后,ReigonServer会被Zookeeper从RS集群清单中移除,HMaster...

2012/12/23 15:53
2.1K
HBase性能优化方法总结

本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,这里涉及的不多,这部分可以参考:淘宝Ken Wu同学的博客。 1. 表的设计 1.1 Pre-Cr...

2012/11/29 00:12
2K
用 Java 对 hbase 进行CRUD增删改查操作

本文以HBase 0.90.2为例,介绍如何在Windows系统,Eclipse IDE集成环境下,使用Java语言,进行HBase客户端编程,包含建立表、删除表、插入记录、删除记录、各种方式下的查询操作等。 1. 准备...

2012/11/29 00:06
4.5K
一条数据的HBase之旅,简明HBase入门教程

1、一条数据的HBase之旅,简明HBase入门教程-开篇 http://www.nosqlnotes.com/technotes/hbase/hbase-overview-concepts/ 2、一条数据的HBase之旅,简明HBase入门教程-Write全流程 http://w...

2012/11/28 23:51
979
HBase 伪分布式安装教程

If you have successfully configured Hadoop on a single machine in pseudo-distributed mode and looking for some help to use Hbase on top of that then you may find this writeup us...

2012/11/26 14:55
3.1K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部