加载中
数据仓库架构演进与菜鸟实时数据仓库设计

1.数据仓库简介 数据仓库是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。 数据仓库...

数据测试常用的 Data Profiling 方法

现在对数据质量的要求越来越高,面对一个动辄上亿条数据的报表如何快速对它的数据质量做出分析呢?给大家分享下我们测试时用到的Data Profiling方法。 Data Profiling,可以大概翻译“数据概...

2015/06/01 00:56
864
美图 AB Test 实践:Meepo系统

2008 年 11 月 4 日,奥巴马在选举中胜出,出任美国第 44 任总统。这次竞选的成功离不开其个人人格魅力,但他的竞选宣传团队的作用也不可小觑。在总统竞选页面上,他的团队用 AB 实验在 16 种...

2014/08/17 00:28
888
美团数据仓库的演进

美团数据仓库,在过去的两年中,与我们的业务一起高速发展。在这一演进过程中,有很多值得总结和沉淀的内容。这篇文档回顾下美团数据仓库这两年发展过程中遇到的各种问题,为什么选择了现在的...

2014/05/20 00:00
979
浅谈数据仓库的基本架构

  数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部...

2013/12/31 03:02
38.3K
BI/数据仓库/数据分析 基础入门:一些常见概念解释

Preface:本文将会讲述 BI/DW/DA 领域的一些常见概念,如:事实表、维度表、建模、多维分析、cube 等,但不涉及具体实例分析。 1、维(Dimension) 维是用于从不同角度描述事物特征的,一般维...

10 分钟简读经典著作 Data Warehouse Toolkit

数据仓库(简称数仓)是我很感兴趣的领域,也是我目前工作职责中重要的部分。想学习这个领域的同学,或许听过《 Data Warehouse Tookit 》这本由 Ralph Kimball 撰写的经典著作。不过这是一本...

2013/12/27 01:18
494
漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)

本文将会谈一谈在数据仓库中拉链表相关的内容,包括它的原理、设计、以及在我们大数据场景下的实现方式。

2013/07/12 22:10
1K
OPPO 数据中台之基石:基于 Flink SQL 构建实数据仓库

本文整理自 2019 年 4 月 13 日在深圳举行的 Flink Meetup 会议,分享嘉宾张俊,目前担任 OPPO 大数据平台研发负责人,也是 Apache Flink contributor。 本文主要内容如下: OPPO 实时数仓的...

有赞数据仓库元数据系统实践

有赞数据仓库背景 业务系统使用 mysql 数据库 数据仓库基于 Hive 构建 业务快速变化,员工数量持续增加 第一版:手工维护的表格 在有赞大数据平台发展初期,业务量不大,开发者对业务完全熟悉...

数据中台买的来么?

在阿里的推动下,大数据借数据中台概念在企业级市场,又火了起来,而且有越来越火的趋势。越来越多的供应商也在陆续推出相关的数据中台产品。那么数据中台买的来么?各位看官别急,先吃点别的...

2012/10/29 21:17
635
企业大数据平台仓库架构建设

随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据不断地产生。新环境下的数据应用呈现业务变化快、数据来源多、系统耦合多、应用深度深等特征。那么基于...

2012/10/27 23:00
385
解码OneData,传说中的阿里数据中台是如何练成的?

据IDC报告,预计到2020年全球数据总量将超过40ZB(相当于4万亿GB),这一数据量是2013年的10倍。正在“爆炸式”增长的数据的潜在巨大价值正在被发掘,它有可能成为商业世界的“新能源”,变革我...

2012/10/15 10:43
1K
DataTalk:ODS层的数据需要做数据清洗吗?

DataTalk:ODS层的数据需要做数据清洗吗? 0x00 前言 本篇的主题是数据分层中的ODS的作用,关于数据分层可以参考本篇博客:如何优雅地设计数据分层。 下面直接进入讨论的主题。 0x01 讨论 问题...

2012/10/12 13:44
3.8K
中台经验谈——从京东、阿里到科蒂 | 42章经

我在京东的搜索与大数据团队和阿里集团中台都待过,后来换到品牌科蒂(全球第三的美妆公司)做数字化转型,也就是在跨国公司做中台。 所以我就从业务和组织架构层面跟大家聊聊在甲乙方都转了...

2012/10/12 12:32
1K
从13页精华PPT一次性讲透阿里中台架构

本文整理了阿里几位技术专家,如架构总监谢纯良、中间件技术专家玄难等几位大牛关于中台架构的几次分享内容,将业务中台形态、中台全局架构、业务中台化、中台架构图、中台建设方法论、中台组...

2012/10/10 16:54
3.6K
建设企业的数据化引擎,网易严选数据中台的经验和方法论

数据中台最早是阿里提出的,但真正火起来是 2018 年,我们能感受到行业文章谈论数据中台的越来越多。大量的互联网、非互联网公司都开始建设数据中台。为什么很多公司开始建设数据中台?尽管数...

2012/09/03 19:40
1K
数据资产管理在腾讯游戏的实践

数据是资产的概念已经成为行业共识。然而现实中,对数据资产的管理和应用尚处于摸索阶段,企业数据资产管理面临价值评估难、数据标准混乱、数据质量不高、数据安全威胁等诸多挑战。互娱从201...

2012/08/18 02:17
452
昨天讲平台、今天变中台,数据中台都干了啥?

1、为解决数据烟囱而来 中国企业的大数据发展大概经历了三个阶段。 第一阶段,是 2000 年之后的企业内部信息化 , 中国许多大型企业开启了一波以数据库、ERP 为主的底层 IT 建设,进行了初步...

2012/08/17 00:14
2.4K
都讲数据中台,听“鼻祖”阿里巴巴正本清源

根据IDC最近发布的《全球云计算IT基础设施市场预测报告》显示:2019年全球云上的IT基础设施占比超过传统数据中心,成市场主导者。 为了迎接这一天的到来,阿里云准备了10年。 到今天,阿里云...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部