加载中
数仓相关面试题

微信公众号 - 大数据技术派 数仓构建 1. 前期业务调研,如需求调研、数据调研、技术调研 2. 提炼业务模型、总线矩阵、划分主题域 定制规范,如命名规范、开发规范、流程规范 数仓架构分层 以...

技术选型 | OLAP大数据技术哪家强?

数据仓库系列文章 数仓建模—指标体系 数仓建模—宽表的设计 数据湖是谁?那数据仓库又算什么? 数据仓库之拉链表 数仓架构发展史 数仓建模分层理论 数据仓库建模方法论 sqoop用法之mysql与h...

基于R语言的主成分分析理论与实例详解

微信搜索:大数据技术派 我的博客:ikeguang.com 数据分析中,我们经常会遇到高维的数据集,这时候就需要降维简化计算和模型。 主成分分析是一种经典的数据降维方法,它要求被分析的变量之间...

SparkStreaming | Flink 实时统计千万级pv, uv

微信公众号:大数据技术派 个人博客:ikeguang.com Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面...

flink-cdc同步mysql数据到hive

本文首发于我的个人博客网站: ikeguang.com 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更新UPD...

flink-cdc同步mysql数据到hbase

本文首发于我的个人博客网站: https://www.ikeguang.com 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入I...

flink-cdc同步mysql数据到kafka

本文首发于我的个人博客网站: https://www.ikeguang.com 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入I...

flink-cdc同步mysql数据到elasticsearch

本文首发于我的个人博客网站 等待下一个秋-Flink 什么是CDC? CDC是(Change Data Capture 变更数据获取)的简称。核心思想是,监测并捕获数据库的变动(包括数据 或 数据表的插入INSERT、更...

数仓建模—建模工具PdMan

数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系...

数据仓库—开发规范

数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系...

数仓建模—OneID

今天是我在上海租房的小区被封的第三天,由于我的大意,没有屯吃的,外卖今天完全点不到了,中午的时候我找到了一包快过期的肉松饼,才补充了1000焦耳的能量。但是中午去做核酸的时候,我感觉...

Spark—GraphX编程指南

Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——...

数仓建模—数据集市

数据仓库系列文章(持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—商业智能系...

数据仓库—数据治理

数据仓库系列文章(部分已出,持续更新) 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 数据仓库之拉链表 数仓—数据集成 数仓—数据集市 数仓—...

数仓建模—指标体系

数据仓库系列文章 数仓架构发展史 数仓建模方法论 数仓建模分层理论 数仓建模—宽表的设计 数仓建模—指标体系 一文搞懂ETL和ELT的区别 数据湖知识点 技术选型 | OLAP大数据技术哪家强? 数仓...

数仓建模—宽表的设计

宽表的设计 其实宽表是数仓里面非常重要的一块,前面我们介绍过了维度表事实表,今天我们介绍一下宽表,前面我们说过了数仓是分层的,这是技术进步和时代变化相结合的产物,数仓的分层式为了...

Hive处理Json数据

Json 格式的数据处理 Json 数据格式是我们比较常用的的一种数据格式,例如埋点数据、业务端的数据、前后端调用都采用的是这种数据格式,所以我们很有必要学习一下这种数据格式的处理方法 准备...

Spark SQL知识点大全与实战

关注公众号:大数据技术派,回复“资料”,领取1000G资料。 本文首发于我的个人博客:Spark SQL知识点大全与实战 1、什么是Spark SQL Spark SQL是Spark用于结构化数据(structured data)处理的...

Spark面试题(七)——Spark程序开发调优

Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)——数据倾斜调优 Spark面试题(六)——Spark资源调优 Spark面试题(七)——...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部