文档章节

HBase Shell操作命令

南寻
 南寻
发布于 2017/07/09 20:31
字数 1162
阅读 488
收藏 13
点赞 1
评论 2

HBase单机配置(官网):

HBase下载http://www.apache.org/dyn/closer.cgi/hbase/

解压缩,然后进入到那个要解压的目录.

$ tar xfz hbase-××××.tar.gz
$ cd hbase-×××××

现在你已经可以启动HBase了。但是你可能需要先编辑 conf/hbase-site.xml 去配置hbase.rootdir,来选择HBase将数据写到哪个目录 .

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>hbase.rootdir</name>
    <value>file:///DIRECTORY/hbase</value>
  </property>
</configuration>

将 DIRECTORY 替换成你期望写文件的目录. 默认 hbase.rootdir 是指向 /tmp/hbase-${user.name} ,也就说你会在重启后丢失数据(重启的时候操作系统会清理/tmp目录)

 

1.创建表
同其它数据库一样,hbase也有表的概念。

hbase(main):001:0> create 'test','cf'
0 row(s) in 1.5210 seconds

=> Hbase::Table - test

这张表的表名叫做test , 有一个列族叫做cf

(注意shell中所有的名字都必须用引号引起来,和传统数据库不同的是,HBASE的表不用定义有哪些列(字段,Column),因为列是可以动态增加和删除的。但Hbase表需要定义列族(column family).每张表有一个或者多个列族,每个列必须且仅属于一个列族。列族主要用来存储上对相关的列分组,从而使得减少对无关列的访问来提高性能。)


下面看看这张表是什么(describe命令)

hbase(main):003:0> describe 'test'
Table test is ENABLED                                                           
test                                                                            
COLUMN FAMILIES DESCRIPTION                                                     
{NAME => 'cf', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP
_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMP
RESSION => 'NONE', MIN_VERSIONS => '0', BLOCKCACHE => 'true', BLOCKSIZE => '6553
6', REPLICATION_SCOPE => '0'}                                                   
1 row(s) in 0.1610 seconds

可以看到HBase给这张表设置了很多默认的属性。

  1. Version:缺省值是3,即默认保存了三个历史版本。就是说,如果一个值被覆盖了,和传统数据库不同,HBase不仅保存了新值,最近的2个值也都相同。
  2. TTL:生存期,一个数据在HBase中被保存的时限。意思是,如果你设置TTL是俩天的话,那么俩天后这个数据会被HBase自动的清楚。如果你希望永久的保存,那把TTL设置到做大就好。

2.插入数据

往表test里插入一些数据:

hbase(main):004:0> put 'test','row1','cf:a','value1'
0 row(s) in 0.1330 seconds

hbase(main):005:0> put 'test','row2','cf:b','value2'
0 row(s) in 0.0150 seconds

hbase(main):006:0> put 'test','row3','cf:c','value3'
0 row(s) in 0.0130 seconds

hbase(main):007:0> put 'test','row1','cf:c','value4'
0 row(s) in 0.0100 seconds

hbase(main):008:0> put 'test','row1','cf:c','value4'
0 row(s) in 0.0100 seconds

hbase(main):009:0> put 'test','row1','cf:c','value4'
0 row(s) in 0.0100 seconds

上面的命令往表test里放了3行数据。命令put就是往表中插入或者更新一条数据。HBase表中的每一行数据都由一个行主键来标识,所以我们用row1,row2这样的字符串来标识相应的行。每一行由“列族:列名”这样的组合来标识,所以cf:a就是在列族cf中名为a的列。命令的最后一个参数是该列的值。

3.读出数据

下面读出所有数据

hbase(main):010:0> scan 'test'
ROW                   COLUMN+CELL                                               
 row1                 column=cf:a, timestamp=1499600631906, value=value1        
 row1                 column=cf:c, timestamp=1499600731612, value=value4        
 row2                 column=cf:b, timestamp=1499600686798, value=value2        
 row3                 column=cf:c, timestamp=1499600707212, value=value3        
3 row(s) in 0.0480 seconds

可以看到一共有四条数据

每条数据都有一个时间戳,这是HBase写入时记录的系统时间。

用表格描述这张表

row key column family: cf
a b c
row1 value1   value4
row2   value2  
row3     value3

 

空的表格并不代表这里有这个单元格存在。在传统数据库中,空白单元表示该单元存在但其值为空(传统数据库总是结构化的)。但这里画成二维表只是便于理解,其本质上完全是非结构化的。

例如:我们使用get来获取特定一行的数据:

hbase(main):019:0> get 'test','row2'
COLUMN                CELL                                                      
 cf:b                 timestamp=1499600686798, value=value2                     
1 row(s) in 0.0400 seconds

4.更新数据

更新test一个单元(将row1的cf:a列更新值为value5):

hbase(main):020:0> put 'test' , 'row1' ,'cf:a' , 'value5'
0 row(s) in 0.0210 seconds

结果:

hbase(main):021:0> scan 'test'
ROW                   COLUMN+CELL                                               
 row1                 column=cf:a, timestamp=1499602903513, value=value5        
 row1                 column=cf:c, timestamp=1499601334793, value=value5        
 row2                 column=cf:b, timestamp=1499600686798, value=value2        
 row3                 column=cf:c, timestamp=1499600707212, value=value3        
3 row(s) in 0.0350 seconds

5.删除数据

用以下命令删除这张表:


hbase(main):022:0> disable 'test'
0 row(s) in 2.2800 seconds

hbase(main):023:0> drop 'test'
0 row(s) in 1.2600 seconds

HBase中删除表必须先把表下线(disable) ,  然后才能把表删除掉。

运行以下命令退出Shell:

hbase(main):024:0> exit

 

© 著作权归作者所有

共有 人打赏支持
南寻
粉丝 60
博文 90
码字总数 35772
作品 0
朝阳
程序员
加载中

评论(2)

南寻
南寻

引用来自“wannshan”的评论

表格是不是错位了?
不知道为什么,我编辑的时候好好地,保存提交后就自动错位了
w
wannshan
表格是不是错位了?
hbase 数据库简介安装与常用命令的使用

一:hbase 简介与架构功能 二:hbase 安装与配置 三:hbase 常见shell 命令操作 一:hbase 简介与架构功能 1.1 为什么要使用hbase 数据库 1.2 hbase 简介: 1.3 HBase与Hadoop的对比 1.4 HB...

flyfish225 ⋅ 04/12 ⋅ 0

hbase shell中disable 和drop无法执行

1 通过hbase的web监控页面查询工作状态发现Regions in Transition区域有长时间未执行的任务,此时需要关闭hbase-master并重启,再这个问题处理过程中我直接使用/etc/init.d/hbase-master re...

CARYFLASH ⋅ 06/04 ⋅ 0

win环境下 hbase 数据库搭建流程

Hbase单机版安装使用教程 Hbase介绍请参考技术支持文档,这里只说明Hbase 的安装和使用 第一步:下载安装Hbase数据库 链接:链接:https://pan.baidu.com/s/1si6Nokvz8xkUsmefsRlntQ 密码:k...

lijiaweizuishuai ⋅ 05/28 ⋅ 0

阿里云HBase安全系列-初体验

概述简介 阿里云HBase安全包括多方面的措施,主要构成部分有:网络隔离,白名单,身份认证,权限控制,数据加密等,具体介绍可参考文章底部链接。本文主要是阿里云HBase安全实战体验篇,介绍...

HBase技术社区 ⋅ 04/13 ⋅ 0

【HBase从入门到精通系列】误删数据如何抢救?

摘要: 前言 有时候我们操作数据库的时候不小心误删数据,这时候如何找回?mysql里有binlog可以帮助我们恢复数据,但是没有开binlog也没有备份就尴尬了。如果是HBase,你没有做备份误删了又如...

阿里云云栖社区 ⋅ 06/12 ⋅ 0

docker入门到实战(9)docker快速安装hbase

下载镜像 docker pull harisekhon/hbase 运行容器 docker run -ti harisekhon/hbase当你执行成功之后直接进入hbase shell,慢慢享用吧 使用hbase 退出容器后,下次再进入可以使用 docker exe...

编程老司机 ⋅ 05/14 ⋅ 0

记一次测试环境Hbase数据备份恢复以及恢复后部分表无法删除的问题处理

一、Hbase数据备份恢复 说明: 因为测试环境要修改hadoop配置文件hdfs-site.xml的参数hdfs.rootdir 修改前的配置 hbase.rootdir hdfs://masters/hbase1 修改后的配置 hbase.rootdir hdfs://m...

断臂人 ⋅ 06/15 ⋅ 0

Hbase+Phoenix 安装及基本操作

1.安装Hbase: 解压:tar-zxvf hbase-1.2.1-bin.tar.gz 重命名:mvhbase-1.2.1 hbase 2.配置环境变量 exportJAVAHOME=/usr/local/software/jdk1.8.066 exportCLASSPATH=.:$JAVAHOME/lib/dt.j......

sinadrew ⋅ 04/12 ⋅ 0

HBase流量限制和表负载均衡剖析

1.概述   在HBase-1.1.0之前,HBase集群中资源都是全量的。用户、表这些都是没有限制的,看似完美实则隐患较大。今天,笔者就给大家剖析一下HBase的流量限制和表的负载均衡。 2.内容   也...

smartloli ⋅ 2017/11/11 ⋅ 0

Sqoop数据导入到HBase遇上的问题及解决方法

  【IT168 技术】运行bin/sqoop import --connect jdbc:mysql://ip:port/database --username * --password **--hbase-bulkload --hbase-create-table --column-family info --hbase-row-k......

中国大数据 ⋅ 05/31 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

开启Swarm集群以及可视化管理

在搭建的两台coreos服务器上开启swarm集群 前置条件: docker均开启2375端口 同一个局域网内 主服务器上安装Portainer容器 安装Portainer容器执行: docker run -d -p 9000:9000 --restart=a...

ykbj ⋅ 19分钟前 ⋅ 0

单例设计模式

1、单例模式确保某一个类只有一个实例,而且自行实例化并向整个系统提供这个实例 2、饿汉式单例类 在这个类被加载时,静态变量instance会被初始化,此时类的私有构造子会被调用 饿汉式是典型...

职业搬砖20年 ⋅ 24分钟前 ⋅ 0

前端基础(四):前端国际规范收集

字数:1142 阅读时间:5分钟 前言 由于前端技术的灵活性和杂乱性,导致网上的许多解决方案不够全面甚至是完全错误,容易起到误导作用。所以,我对搜索到的解决方案往往是存疑态度。那么,如何...

老司机带你撸代码 ⋅ 26分钟前 ⋅ 0

Failed to open/create Network-VirtualBox Host-Only

虚拟机版本 : Oracle Vm VirtualBox 5.2.12 报错时机:开网卡二,重启虚拟机报错 "Failed to open/create the internal network 'HostInterfaceNetworking-VirtualBox Host-Only Ethernet Ada......

p至尊宝 ⋅ 29分钟前 ⋅ 0

三分钟学会如何在函数计算中使用 puppeteer

摘要: 使用 puppeteer 结合函数计算,可以快速的构建弹性的服务完成各种功能,包括:生成网页截图或者 PDF、高级爬虫,可以爬取大量异步渲染内容的网页、模拟键盘输入、表单自动提交、登录网...

阿里云云栖社区 ⋅ 32分钟前 ⋅ 0

springMVC接收表单时 Bean对象有Double Int Char类型的处理

前台ajax提交表单price为double类型 后台controller就介绍不到 400错误 前台 实体类: public class ReleaseMapIconConfig{ private String id; private long maxValue; private long minVal......

废柴 ⋅ 35分钟前 ⋅ 0

ZOOKEEPER安装

工作需要在ubuntu上配置了一个zookeeper集群,有些问题记录下来。 1. zookeeper以来java,所以首先要安装java。但是ubuntu系统有自带的jdk,需要通过命令切换java版本: $ sudo update-alter...

恰东 ⋅ 37分钟前 ⋅ 0

linux 进程地址空间的一步步探究

我们知道,在32位机器上linux操作系统中的进程的地址空间大小是4G,其中0-3G是用户空间,3G-4G是内核空间。其实,这个4G的地址空间是不存在的,也就是我们所说的虚拟内存空间。 那虚拟内存空间...

HelloRookie ⋅ 38分钟前 ⋅ 0

myatis #{}与${}区别及原理

https://blog.csdn.net/wo541075754/article/details/54292751

李道福 ⋅ 41分钟前 ⋅ 0

三分钟学会如何在函数计算中使用 puppeteer

摘要: 使用 puppeteer 结合函数计算,可以快速的构建弹性的服务完成各种功能,包括:生成网页截图或者 PDF、高级爬虫,可以爬取大量异步渲染内容的网页、模拟键盘输入、表单自动提交、登录网...

猫耳m ⋅ 42分钟前 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部