加载中
数据平台架构选型三之CDH

数据平台架构选型: 一般常见大数据使用场景分别有几种:离线批处理,实时流处理,olap多维度仓储统计分析,Ad hoc即席探索分析;相应需求可以选择相应架构做处理,这里可以参考原先我们在E...

数据仓库与数据湖之间有何区别?

数据仓库是一种具有正式架构的成熟的、安全的技术。它们存储经过全面处理的结构化数据,以便完成数据治理流程。数据仓库将数据组合为一种聚合、摘要形式,以在企业范围内使用,并在执行数据写...

Druid + Superset

Divolte + Kafka + Druid + Superset 在当今世界,您希望尽快向客户学习。本博客介绍了如何使用开源技术设置流分析。我们将使用Divolte,Kafka,Superset和Druid建立一个系统,让您即时深入了...

Presto架构及原理、安装及部署

Presto 是 Facebook 推出的一个基于Java开发的大数据分布式 SQL 查询引擎,可对从数 G 到数 P 的大数据进行交互式的查询,查询的速度达到商业数据仓库的级别,据称该引擎的性能是 Hive 的 10...

2019/01/27 17:56
6.5K
SparkSQL自适应执行

编辑 · 本页目录 解决问题 测试 阿里云EMR-3.13.0版本的SparkSQL支持自适应执行功能,用来解决Reduce个数的动态调整/数据倾斜/执行计划的动态优化问题。 解决问题 SparkSQL自适应执行解决以...

2019/01/27 15:36
4.1K

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部