Streaming SQL在贝壳的演进之路 原文发自公司对外公众号,作者笔名顾渊离,本人,转载请注明出处 背景 实时计算平台是贝壳内部统一承接实时需求和管理实时任务的平台,支持了公司埋点、商机、...
openpyxl 使用 install pip install openpyxl #python2 open && create excel open import openpyxl openpyxl.load_workbook(INPUT_FILE) create from openpyxl import Workbook wb = Workb...
Varints 编码 Varint 是一种紧凑的表示数字的方法。它用一个或多个字节来表示一个数字,值越小的数字使用越少的字节数。这能减少用来表示数字的字节数。 Varint 中的每个字节(最后一个字节除...
sychronized用法 修饰代码段 public class Test { Object lock = new Object(); int i = 0; public void f() { sychronized (lock) { i++; } } } 适用于方法体比较大或者耗时,但需要同步的代...
锁的类型 锁的类型从不同的角度看,主要分为以下几种 悲观锁、乐观锁 阻塞、非阻塞、自旋锁 公平、非公平 可重入、不可重入 共享锁、排他锁 悲观锁和乐观锁 悲观锁 悲观锁认为自己在使用数据...
记Structured Streaming 2.3.1的OOM排查过程 缘起 最近在使用Structured Streaming开发一套自助配置SQL的来生成流式作业的平台,在测试的过程中发现有些作业长时间运行后会有Executor端的OOM...
分布式存储初探 缘起 最近公司内部在做dmp服务,目前的方案都是搭建不同的redis集群,将数据灌到redis集群中系统查询服务供线上使用。但是随着数据量的增大以及数据源的多样性,再加上线上服...
Spark 内存管理详解 通常我们讨论的是Executor中的内存管理,自1.6版本后spark的内存分为两个部分, 堆内内存和堆外内存。下面详细针对这两个部分进行详细的介绍。 堆内内存 堆内内存的大小,...
Spark源码阅读——streaming模块作业生成和提交 通常我们开发spark-streaming都会用到如下代码: val sparkConf = new SparkConf() .set("xxx", "") ... val sc = new SparkContext(sparkCon...
Spark 源码阅读——任务提交过程 当我们在使用spark编写mr作业是,最后都要涉及到调用reduce,foreach或者是count这类action来触发作业的提交,所以,当我们查看这些方法的源码时,发现底层都...
没有更多内容
加载失败,请刷新页面
文章删除后无法恢复,确定删除此文章吗?
动弹删除后,数据将无法恢复
评论删除后,数据将无法恢复