加载中
Spark Parquet file split

在实际使用 spark + parquet 的时候, 遇到了两个不解的地方: 我们只有一个 parquet 文件(小于 hdfs block size), 但是 spark 在某个 stage 生成了4个 tasks 来处理. 4个 tasks 中只有一个 ta...

Spark DateType cast 踩坑

前言 在平时的 Spark 处理中常常会有把一个如 2012-12-12 这样的 date 类型转换成一个 long 的 Unix time 然后进行计算的需求.下面是一段示例代码: val schema = StructType( Array( StructF...

Go Concurrency 实战

前言 本文先介绍了goroutine的原理,懂了原理之后,goroutine也就没有那么的神秘了.接下来介绍了goroutine的使用.最后介绍了一些goalng并发常用的模式. goroutine实现基础 Go直接在语言里内置了...

字节跳动内推啦

字节跳动招人, 待遇/福利无双! 应届生: 字节跳动校招内推码: CH7U9JD 投递链接: https://job.toutiao.com/campus/ 社招: https://job.toutiao.com/s/be8Exo......

高性能Web Server思考

0xFF Web服务可以让你在HTTP协议的基础上通过XML或者JSON来交换信息。 醍醐灌顶!!! 你可以编写一段简短的代码,通过抓取这些信息然后通过标准的接口开放出来,就如同你调用一个本地函数并返回...

Go transport 剖析

使用golang net/http库发送http请求,最后都是调用 transport的 RoundTrip方法 type RoundTripper interface { RoundTrip(*Request) (*Response, error) } RoundTrip executes a singl...

Java虚拟机精讲之内存分配与垃圾回收

1 线程共享内存区 Java堆区 用于存储Java对象实例,但是不一定是Java对象内存分配的唯一选择(为了降低GC频率).在JVM启动的时候大小就已经设定好了.(-Xmx最大 -Xms起始) 超过最大内存的时候,抛...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部