加载中
hive-order by 时null值处理

order by 时,desc NULL 值排在首位,ASC时NULL值排在末尾 可以通过NULLS LAST、NULLS FIRST 控制 RANK() OVER (ORDER BY column_name DESC NULLS LAST)......

2019/06/19 22:01
3.4K
HIVE-计算累计和

eg:统计1-12月的累积销量,即1月为1月份的值,2月为1.2月份值的和,3月为123月份的和,12月为1-12月份值的和 SELECT month,SUM(amount) month_amount, SUM( SUM(amount)) OVER (ORDER BY mo...

2019/06/19 21:58
2.6K
hive表在join on上的过滤和在where上过滤的对比

当两张表A和B在join时,条件筛选放在表join时的on上面和放在where上面得到的结果是不一样的。 如下创建两张表: A表结构以及数据: id name grade dept 1 lijie1 100 10 2 lijie2 90 20 3 .....

2019/06/19 21:52
1.5K
hive锁

Hive中定义了两种锁的模式:共享锁(S)和排它锁(X),顾名思义,多个共享锁(S)可以同时获取,但是排它锁(X)会阻塞其它所有锁。 如果select一张表,这张表则会进入shared模式,增加、插入、...

2019/06/19 21:40
634
统计不同用户两两之间出现的相同产品

数据样例: U3 A U1 B U2 A U4 A --结果: U1,U2 A,B U1,U3 A U1,U4 A U2,U3 A U2,U4 A U3,U4 A 要点:先按照用户分区排序,使用窗口函数做出标记,然后按照左表rank值小于右表rank值和两两用...

2019/06/19 21:36
158
hive-sum(a+b)与sum(a)+sum(b)的区别

hive> select * from tmp.test_sum; OK 1 2 NULL 3 4 2 1 NULL select sum(a+b),sum(a)+sum(b) from tmp.test_sum; 结果:9 13 说明sum(a+b)是先a+b然后求和,那么a+b当中有一个是N......

2019/06/19 21:28
1.3K
HIVE SQL优化

作为数据仓库的利器,大部分的数仓工作者大部分时间都在写Hive Sql,根据作者经验整理出单纯的Hive Sql调优。 一. 普通场景下的sql优化 1. 列裁剪 由于数仓底层存储大都采用列式存储,如ORC...

2019/06/19 20:05
1K
hive ddl随手记

1.beeline cli 嵌入模式: beeline !connect jdbc:hive2://localhost:10000 输入用户名和密码 远程模式 beeline -u jdbc:hive2://s252:10000 -n root beeline -u "jdbc:hive2://localhost:10...

2019/06/19 18:11
53

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部