文档章节

Hive的简单操作(37)

肖鋭
 肖鋭
发布于 2014/04/09 21:11
字数 362
阅读 71
收藏 2

对Hive表的操作

        hive -e "CREATE TABLE t3(id INT)";

        hive -e可以不在hive shell脚本里面执行;

1    普通表

        CREATE TABLE t1(id INT);

        hive插入数据:LOAD DATA LOCAL INPATH '/root/Downloads/seq' INTO TABLE t1;

        指定分隔符:(才能插入两列的数据)

        CREATE TABLE IF NOT EXISTS t2(fi INT,se INT) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

        然后在加载数据:

        LOAD DATA LOCAL INPATH '/root/Downloads/sort' INTO TABLE t2;

2    分区表

        CREATE TABLE IF NOT EXISTS t3(id INT) PARTITIONED BY(log_month STRING);

        LOAD DATA LOCAL INPATH '/root/Downloads/seq' INTO TABLE t3 PARTITION (log_month="201404");

3    外部表

        /apache_logs:数据文件在外部,不在hive/warehouse下.

        在测试中:/apache_logs数据文件时存放在HDFS中.

        注意:/apache_logs下的数据必须要规范.

        CREATE EXTERNAL TABLE IF NOT EXISTS t4(id INT) LOCATION '/apache_logs';

4    外部分区表

        CREATE EXTERNAL IF NOT EXISTS t5(id INT) PARTITIONED BY (log_date STRING) LOCATION '/apache_logs';

        注意:增加分区前,要数据插入到/apach_logs/2014_04-09

        例如:

                    hadoop fs -cp /apache_logs/seq    /apache_logs/2014_04_09

                    hadoop fs -cp /apache_logs/seq    /apache_logs/2014_04_10

                    hadoop fs -cp /apache_logs/seq    /apache_logs/2014_04_11

            seq是文件,2014_04_*是文件夹

            ALTER TABLE IF EXISTS t5 ADD PARTITION(log_date='2014_04_09') LOCATION '/apache_logs/2014_04_09';

            删除分区:

            ALTER TABLE IF EXISTS t5 DROP PARTITION(log_date='2014_04_09');

5    查看hive中的函数

            进入hive按键盘Tab键,输入Y.

            查看函数的描述:DESCRIBE FUNCTION instr;(查看instr函数描述)

 

                                                                                                                                        Name:Xr

                                                                                                                                        Date:2014-04-09 21:11

© 著作权归作者所有

肖鋭
粉丝 10
博文 62
码字总数 29531
作品 0
朝阳
程序员
私信 提问
Hive从入门到实战视频教程【40讲全】

1、Hive是什么,Hive的体系结构,Hive和Hadoop的关系 2、Hive的元数据存储、Hive的数据存储、Hive和RDBMS的区别 3、JDK安装 4、Hadoop集群搭建-1 5、Hadoop集群搭建-2 6、Hadoop集群搭建-3 ...

tom先生
2014/11/26
58
0
Hive安装步骤(依赖Hadoop)

1、解压缩文件[root@hadoop0 opt]# tar -zxvf hive-0.9.0.tar.gz 2、改名字[root@hadoop0 opt]# mv hive-0.9.0 hive 3、配置环境变量,修改etc/profile全局变量文件/opt/hive/bin JAVAHOME=......

闪电
2016/07/01
90
0
0032-如何在CDH启用Kerberos的情况下安装及使用Sentry(二)

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 5.Sentry列权限管理 1.在集群所有节点添加fayson_r用户 2.创建Kerberos用户fayson_r 3.使用hive用户登录Kerberos 使用bee...

Hadoop实操
2018/11/22
28
0
hadoop hive hbase 入门学习 (二)

//////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// hadoop 自学系列 hado......

curiousby
2015/03/08
0
0
Spark 2.0视频|快学Spark 2.0(新特性、含真实项目、纯Scala语言开发、CDH5.7)

快学Spark 2.0(新特性、含真实项目、纯Scala语言开发、CDH5.7) 分享网盘下载——https://pan.baidu.com/s/1c2F9zO0 密码: pzx9 Spark进入2.0时代,引入了很多优秀特性,性能上有较大提升,A...

jgkmeymds
2017/10/20
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Bettertouchtool for Mac(触摸板增强工具) v3.225

Bettertouchtool Mac是一个MacOS上的触摸板增强工具,当然,你也可以称它为鼠标增强软件!Bettertouchtool实现不用点击而是触摸的方式操作。支持多种手势,1个,2个,3个手指的操作,支持缩放...

云不若
32分钟前
5
0
如何在MySQL中执行正则表达式替换?

我有一张约有50万行的表格; varchar(255)UTF8列filename包含一个文件名; 我正在尝试从文件名中去除各种奇怪的字符-以为我会使用字符类: [^a-zA-Z0-9()_ .\\-] 现在, MySQL中是否有一个...

技术盛宴
38分钟前
9
0
如何将存储卡转换为DVD

将存储卡转换为DVD是一项非常简单的任务,因为您只需要使用一些软件:读卡器,DVD和DVD刻录机以及软件即可。做好准备后,您现在就可以将文件传输到所需的目的地。但是,如果要使您的文件看起...

麦克虾仔
45分钟前
5
0
Elasticsearch 开箱指南

内容概要 ES 基础介绍,重点是其中的核心概念。 基础 API 实践操作。 1. 基础介绍 Elasticsearch (ES) 是一个数据库,提供了分布式的、准实时搜索和分析。 基于 Apache Lucene,可以操作结构...

性能与架构
47分钟前
7
0
聚合支付平台的安全防护 防止被攻击篡改的2020年方案篇

临近春节,某聚合支付平台被攻击篡改,导致客户提现银行卡信息被修改,支付订单被恶意回调,回调API接口的数据也被篡改,用户管理后台被任意登入,商户以及码商的订单被自动确认导致金额损失...

网站安全
今天
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部