加载中
Impala-JDBC使用方法

作为Impala开源的主要贡献者Cloudera,致力于将大数据的商务智能,数据分析,数据统计与挖掘变得容易而且简单。Cloudera JDBC 被用来直接用SQL的方式连接Hadoop-Impala大数据分布式集群,易用...

2017/02/21 15:57
2.5K
spark-alluxio生产环境的应用与实践

Alluxio(前身Tachyon)作为内存式计算框架的产物,作为内存式的文件系统,Alluxio的应用场景也显得尤为的广泛。在大数据如火如荼发展到今天,众多公司对于spark的青睐似乎又是选择的必然。那...

2016/10/18 17:08
623
Hive解决数据倾斜问题(GC overhead limit exceeded)的有效办法。

Hive执行脚本时候报错:GC overhead limit exceeded 。 导致脚本无论如何都跑不通,因为同样的脚本在跑其他的分区的时候可以得,只是这一个分区跑不通,所以初步猜测是因为数据倾斜的原因。...

2016/05/20 14:11
1K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部