文档章节

hive 的基本的建表语句

LianM
 LianM
发布于 2017/01/03 22:52
字数 344
阅读 12
收藏 0

Hive是什么

Hive 是建立在 Hadoop  上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL ),这是一种可以存储、查询和分析存储在 Hadoop  中的大规模数据的机制。Hive 定义了简单的类 SQL  查询语言,称为 QL ,它允许熟悉 SQL  的用户查询数据。同时,这个语言也允许熟悉 MapReduce  开发者的开发自定义的 mapper  和 reducer  来处理内建的 mapper 和 reducer  无法完成的复杂的分析工作。

Hive的建表语句:

类似于mysql语法:

Create database store;--创建数据库

truncate table student;--清空表数据

Create table student(id int, s_name String)- -创建表()

Row format delimited Fields terminated by ‘,’;每行按什么切分

 

 

 

创建内部表mytable:

         Create table if not exists mytable(sid int,sname string)

         Row format delimited fields terminated by ‘,’—行分割;

         Stored as textfile—文本类型,如果是采用压缩的方式则为STORED AS SEQUENCEFILE

创建外部表pageview

Create external table if not exists pageview(pageid int,page_url string comment ‘the page url’)

Row format delimited fields terminated by ‘,’

Location ‘hdfs://192.168.33.68:9000/user/hive/warehouse/’—表中的数据存储位置

 

 

创建分区表

Create table student (sid int,sname string)

Partition by(part string)

Row format delimited fields terminated by ‘,’

Stored as textfile;

 

将外部的数据导入到表中

Load data lacal inpath /home/hadoop/data overwrite into table pageview;

 

 

© 著作权归作者所有

LianM
粉丝 0
博文 8
码字总数 5024
作品 0
昌平
私信 提问
Spark通过修改DataFrame的schema给表字段添加注释

我的原创地址:https://dongkelun.com/2018/08/20/sparkDfAddComments/ 1、需求背景 通过Spark将关系型数据库(以Oracle为例)的表同步的Hive表,要求用Spark建表,有字段注释的也要加上注释...

董可伦
2018/11/16
0
0
hive建表的标准格式及其建表属性详解2

版权声明:本文为博主原创文章,未经博主女朋友允许不得转载。 https://blog.csdn.net/qq_26442553/article/details/79747906 建表方式一:demo级建表 hive (fdmsor)> create table mytmp (i...

牛大财有大才
2018/03/30
0
0
使用Apache Impala(CDH6)查询OSS的数据

CDH6 目前CDH的最新版本是6.0.1,支持Hadoop 3.0.0,本文将介绍如何使CDH6的相关组件(Hadoop/Hive/Spark/Impala等)能够读写OSS。CDH5对OSS的支持在这篇文章介绍。 CDH6支持读写OSS 搭建CDH集...

冷月_wjh
2018/10/30
0
0
教程:Data Lake Analytics + OSS数据文件格式处理大全

0. 前言 Data Lake Analytics是Serverless化的云上交互式查询分析服务。用户可以使用标准的SQL语句,对存储在OSS、TableStore上的数据无需移动,直接进行查询分析。 目前该产品已经正式登陆阿...

金络
2018/08/07
0
0
hive元数据解析、并且提取表结构

hive所有的表结构信息都存储在metastore中,而所有的数据都存储在hdfs之上,所以我们想要获得表结构信息,就需要知道hive的元数据中每个表的含义和结构。 在hive中,有简单的命令可以大概的查...

cjun1990
2016/04/26
4.2K
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring Cloud 笔记之Spring cloud config client

观察者模式它的数据的变化是被动的。 观察者模式在java中的实现: package com.hxq.springcloud.springcloudconfigclient;import org.springframework.context.ApplicationListener;i...

xiaoxiao_go
今天
4
0
CentOS7.6中安装使用fcitx框架

内容目录 一、为什么要使用fcitx?二、安装fcitx框架三、安装搜狗输入法 一、为什么要使用fcitx? Gnome3桌面自带的输入法框架为ibus,而在使用ibus时会时不时出现卡顿无法输入的现象。 搜狗和...

技术训练营
今天
4
0
《Designing.Data-Intensive.Applications》笔记 四

第九章 一致性与共识 分布式系统最重要的的抽象之一是共识(consensus):让所有的节点对某件事达成一致。 最终一致性(eventual consistency)只提供较弱的保证,需要探索更高的一致性保证(stro...

丰田破产标志
今天
7
0
docker 使用mysql

1, 进入容器 比如 myslq1 里面进行操作 docker exec -it mysql1 /bin/bash 2. 退出 容器 交互: exit 3. mysql 启动在容器里面,并且 可以本地连接mysql docker run --name mysql1 --env MY...

之渊
今天
7
0
python数据结构

1、字符串及其方法(案例来自Python-100-Days) def main(): str1 = 'hello, world!' # 通过len函数计算字符串的长度 print(len(str1)) # 13 # 获得字符串首字母大写的...

huijue
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部