加载中
数仓开发需要了解的5大SQL分析函数

基本语法 analytic_function_name([argument_list]) OVER ( [PARTITION BY partition_expression,…] [ORDER BY sort_expression, … [ASC|DESC]]) analytic_function_name: 函数名称 — 比如...

推荐几位大佬的公众号,获得阿里、腾讯、百度、京东、字节、美团的内推机会

技术的海洋,没有终点,只有杨帆,“书山有路勤为径,学海无涯苦作舟”我们扬帆起航、乘风破浪,当然技术的知识海洋少不了的公众号的陪伴。轻扫一下二维码就行了,你可以试试,肯定会有意外收...

欢迎添加博主微信,期待与你一起交流

你不可能从现在预测到未来,只有回头看时,才会发现事物之间的联系。所以你必须相信,那些生命中的点点滴滴,将会在你未来的生命里以某种方式串联起来。你必须相信一些东西---你的勇气、宿命...

第十一篇|基于SparkSQL的电影分析项目实战

在之前的分享中,系统地介绍了Spark的基本原理和使用方式,感兴趣的可以翻看之前的分享文章。在本篇分享中,将介绍一个完整的项目案例,该案例会真实还原企业中SparkSQL的开发流程,手把手教...

分享下 Flink、Kafka中经典的架构师级ZooKeeper企业应用实践

社会最稀缺的是 π 型人才。 -- 美团联合创始人王慧文 随着全行业数字化转型和新基建时代的到来,市场对技术人才提出了更高的要求。9月22日上午,美团联合创始人兼高级副总裁王慧文在清华演讲...

聊聊

你不可能从现在预测到未来,只有回头看时,才会发现事物之间的联系。所以你必须相信,那些生命中的点点滴滴,将会在你未来的生命里以某种方式串联起来。你必须相信一些东西---你的勇气、宿命...

篇五|ClickHouse数据导入(Flink、Spark、Kafka、MySQL、Hive)

本文分享主要是ClickHouse的数据导入方式,本文主要介绍如何使用Flink、Spark、Kafka、MySQL、Hive将数据导入ClickHouse,具体内容包括: 使用Flink导入数据 使用Spark导入数据 从Kafka中导入...

历史归档

你不可能从现在预测到未来,只有回头看时,才会发现事物之间的联系。所以你必须相信,那些生命中的点点滴滴,将会在你未来的生命里以某种方式串联起来。你必须相信一些东西---你的勇气、宿命...

面试|不可不知的十大Hive调优技巧最佳实践

Apache Hive是建立在Apache Hadoop之上的数据仓库软件项目,用于提供数据查询和分析。Hive是Hadoop在HDFS上的SQL接口,它提供了类似于SQL的接口来查询存储在与Hadoop集成的各种数据库和文件系...

转AI必看!2020最新版《神经网络与深度学习》中文版更新完毕,PDF免费开放下载~

介绍 《神经⽹络和深度学习》是⼀本免费的在线书,对读者数学知识需求适度,兼顾理论和动手实践。 ⽬前给出了在图像识别、语⾳识别和⾃然语⾔处理领域中很多问题的最好解决⽅案,教读者在神经...

欢迎添加博主微信,期待与你一起交流

你不可能从现在预测到未来,只有回头看时,才会发现事物之间的联系。所以你必须相信,那些生命中的点点滴滴,将会在你未来的生命里以某种方式串联起来。你必须相信一些东西---你的勇气、宿命...

第十篇|SparkStreaming手动维护Kafka Offset的几种方式

Spark Streaming No Receivers 方式的createDirectStream 方法不使用接收器,而是创建输入流直接从Kafka 集群节点拉取消息。输入流保证每个消息从Kafka 集群拉取以后只完全转换一次,保证语义...

Hive常见的分析函数

1.基本语法 Function (arg1,..., argn) OVER ([PARTITION BY <...>] [ORDER BY <....>] [<window_expression>]) Function (arg1,..., argn) 可以是下面的四类函数: Aggregate Functions: 聚...

Impala的组件和架构介绍

一、概述 1.1简介 Impala是由Cloudera公司开发的新型查询系统,能够对存储在HDFS、HBase以及S3上的数据进行快速的交互式SQL查询。另外,impala与Hive使用了统一的存储系统、同样的元数据库、...

58集团大数据专家:ZooKeeper在OLAP场景下的源码级企业实践

社会最稀缺的是 π 型人才。 -- 美团联合创始人王慧文 随着全行业数字化转型和新基建时代的到来,市场对技术人才提出了更高的要求。9月22日上午,美团联合创始人兼高级副总裁王慧文在清华演讲...

第九篇|Spark的五种JOIN策略解析

JOIN操作是非常常见的数据处理操作,Spark作为一个统一的大数据处理引擎,提供了非常丰富的JOIN场景。本文分享将介绍Spark所提供的5种JOIN策略,希望对你有所帮助。本文主要包括以下内容: ...

第八篇|Spark SQL百万级数据批量读写入MySQL

Spark SQL读取MySQL的方式 Spark SQL还包括一个可以使用JDBC从其他数据库读取数据的数据源。与使用JdbcRDD相比,应优先使用此功能。这是因为结果作为DataFrame返回,它们可以在Spark SQL中轻...

聊一聊技术人的“钱途”在哪里

在刚过去不久的2020中国国际智能产业博览会上,马云在8分钟演讲里30次谈到数字化 ,用数字技术加大研发来降低企业的推广成本、渠道成本、人力成本和管理成本是企业必须要考虑的问题。其实早在...

Kafka生产环境的几个重要配置参数

Kafka在弹性、容错性以及高吞吐量方面有着很大的优势。想要达到生产环境最优,发挥这些特性,需要我们进行一系列的配置。Kafka提供了非常多的配置属性,对于初学者而言,很容易陷入困惑。其实...

推荐几个数据方向优质公众号

在输出文章以及提升技术的过程中,确实发现会有不少的小坑加大坑。“前人栽树,后人乘凉”这话不是说说而已,在自己学习过程中如果能得到他人的帮助相信会顺利很多。读万卷书,不如行万里路,...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部