加载中
Hive Transaction 事务性 小试

提到Hive一般都会想到,Hive是数据仓库,支持类SQL查询,有很多语法支持,可以嵌套MR,写Transform、写UDF/UDAF等,但是,不支持更新操作。所以Hive的常见也一般都是一次写入,频繁读取。从H...

2016/07/14 18:28
9.6K
【转】hive数据倾斜总结

hive数据倾斜总结

2014/06/19 10:42
181
hive UDF 分享 通过IP地址获取 IDC/省份/城市

hive UDF 分享 通过IP地址获取IDC//省份/城市的信息

hive 常用小技巧

平常用的一些东西,懒得整理了,先这么着吧、

2014/05/12 19:30
2.4K
Hive 分组 Limit 非UDF方案

其实前一篇的Mysql 小技巧中having min()的方法是为了本篇准备的。但是当时遇到南墙,这次终于破壁找到方案。 描述: id (自增),type (aaa, bbb,ccc ,ddd),status(ok,error) 三个字段,每个t...

2013/09/16 11:42
2.7K
Hive 万恶的下划线 -- load数据时指定的文件不要以下划线开头

简述:hive load数据时,文件的命名不要以_开头。 1. 先看下要导入的文件,\t 分割。 cat /tmp/_load.csv 1  aaa  ok 2  aaa  error 3  aaa  ok 4  bbb  ok 5  ccc  error 6  ccc  ok 7  ddd  err...

HIVE默认分区导致 Hive Internal Error: java.lang.NullP...

一条HIVE SQL抛出了异常: select sessidmodex(sessid, 10),count(*),count(distinct sessid),count(distinct visitip) from visitlogs where ((dt='2012-11-14' and vhour>=13) or (dt='20...

hive transform 纠结的前行

1. 编写脚本 1 #!/usr/bin/python 2 import sys 3 from sessionutil import get_channel, from_sub_get_channel 4 5 for line in sys.stdin: 6 line = line.strip() 7 sessid, session_day,...

hive利器 自定义UDF+重编译hive

用hive也有一段时间里,不过一直没写过相关到日志,因为主要用hive也无非是create table,upload data,CRUD 这几个过程。后来工作中需要用到一些常用到方法,了解到hive中支持UDF(User Defi...

2012/06/28 18:52
4.1K
在Ubuntu10.10中安装HIVE

参照:http://wadefall.iteye.com/blog/1204286 一路配置下来没发现什么问题,然后就是利用HIVE跑SQL,执行和第一个Map/Reduce相符的程序了。 1.创建表 create table packCount (userinfo S...

2012/02/23 18:02
261

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部