加载中
面试,Parquet文件存储格式香在哪?

一、Parquet的组成 Parquet仅仅是一种存储格式,它是语言、平台无关的,并且不需要和任何一种数据处理框架绑定,目前能够和Parquet适配的组件包括下面这些,可以看出基本上通常使用的查询引擎...

一哥答疑:数据仓库如何确定主题域?

大家好,我是一哥,前几天跟一个朋友聊了一些数据中台建设的内容,针对数据仓库中主题域如何划分这个话题聊了很多。其实数据仓库建设的理论大家已经都知道了不少,也看过不少书,那么在实际建...

12/03 07:00
44
欢迎入群,数据仓库,数据分析,大数据

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 新建了【数据仓...

从0到1建立数据分析指标体系底层逻辑

—▼— 导读:随着公司业务规模扩大,各类相关的数据量增加,数据指标也越来越多。如果缺乏数据指标体系和分析方案,就会难以判断整体业务发展状况、难以衡量产品/活动效果、等等。 如今,各...

12/01 07:00
1.7K
OLAP计算引擎怎么选?

大家好,我是一哥,今天聊一聊OLAP技术,一哥认为好的OLAP引擎应该具备以下三个条件:易开发、易维护、易移植。今天给大家分享一下常见的几种OLAP计算引擎,他们的特性、适用场景,优缺点等,...

干货 | Apache Flink 入门技术 PPT 分享

之前在团队里和小伙伴们做了关于 Flink 与阿里云 Realtime Compute 的技术分享,今天有时间就把PPT的内容做了整理分享给大家 (多图预警)🙄 前言 Flink 最早期起源于德国柏林工业大学的一...

建设实时数仓之前的思考与方案

导读:本文由作者LittleMagic总结分享授权发布,主要阐述建设实时数仓之前的思考与方案记录。详细分为以下几个方面: 动机背景 指导思想 技术选型 架构分层 元数据管理 SQL作业管理 数据质量...

欢迎入群,数据仓库,数据分析,大数据

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 新建了【数据仓...

浅谈数据仓库质量管理规范

大家好,我是一哥,今天和大家聊一下如何管理数据仓库质量如何管理。 一、 背景 现在数据仓库层面的工作越来越多,开发人员也越来越多,如何保障数据准确性是一项非常重要的工作,,数据仓库...

欢迎入群,数据仓库,数据分析,大数据

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 新建了【数据仓...

收藏,大数据领域全景解析

大数据领域全景解析 长文预警!这是一篇数据体系介绍文章,并不涉及开发实践。 |0x00 什么是数据 数据是一种对客观事物的逻辑归纳,是事实或观察的结果。随着科学技术的发展,数据的概念内涵...

欢迎入群

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 新建了【数据仓...

11/23 07:00
0
传统数仓如何转型大数据

大家好,我是一哥,前几天建了一个数据仓库方向的小群,收集了大家的一些问题,其中有个问题,一哥很想去谈一谈——现在做传统数仓,如何快速转到大数据数据呢?其实一哥知道的很多同事都是从...

浅谈数仓一致性维度

1、一致性维度的概念 维度建模的数据仓库中,有一个概念叫Conformed Dimension,中文一般翻译为“一致性维度”。一致性维度是Kimball的多维体系结构中的三个关键性概念之一,另两个是总线架构...

11/20 07:00
72
欢迎入群

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 新建了【数据仓...

11/18 07:00
0
数据仓库架构(内含PPT)

大数据篇:一文读懂@数据仓库 1 网络词汇总结 1.1 数据中台 数据中台是聚合和治理跨域数据,将数据抽象封装成服务,提供给前台以业务价值的逻辑概念。 数据中台是一套可持续“让企业的数据用...

11/18 07:00
11
干货笔记,数据仓库工具箱

《数据仓库工具箱—维度建模的完全指南》是数据仓库建模方面的经典著作, 1996年第一版出版被认为是数据仓库方面具有里程碑意义的事件。作者kimballl是数据仓库方面的权威,他将多年的数据仓...

大数据资料免费获取~

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 系列文章都是基...

面试,HBase如何设计rowkey

HBase中的rowkey是按字典顺序排序的,通过rowkey查询可以对千万级的数据实现毫秒级响应。然而,如果rowkey设计不合理的话经常会出现一个很普遍的问题----热点。当大量client的请求(读或者写...

欢迎加入大数据学习群

该系列精选文章来自于「数据社」公众号,作者从事过大数据开发,大数据架构,数据分析相关岗位,有着丰富的实战经验。 该系列文章主要包括大数据平台、数据仓库、数据挖掘等。 系列文章都是基...

11/14 08:00
37

没有更多内容

加载失败,请刷新页面

返回顶部
顶部