加载中
Spark性能优化指南二——高级篇

1.如何判断发生数据倾斜? 2.为什么会发生数据倾斜? 3.如何定位导致数据倾斜的代码? 4.Spark Web UI哪些参数可以反映数据倾斜? 5.本文对于数据倾斜提出哪些解决方案? 前言 继基础篇讲解了每...

文本特征提取算法实现

使用java卡方校验(chi-square)和信息增益算法提取文本特征算法实现

Hive外部分区表加载flume打到hdfs上文件,读不到.tmp文件

flume打到hdfs上时,按照文件大小生成文件,在达到指定大小之前数据都是以.tmp文件形式保存在hdfs上,hive外部表也会加载这些文件,但是当文件完成后.tmp会消失,这时候hive会报找不到文件的...

Flume自定义Hbase Sink的EventSerializer序列化类

针对json格式的日志自定义flume hbasesink的序列化类

thrift使用:java作为client端调用python服务端

使用python thrift server,java客户端调用,并返回结果

flume1.6.0 和kafka整合(kafkasink只有在1.6.0以上的flume版本才有)

flume avrosource,mem channel,kafka sink的配置,注意:kafkasink只有在1.6.0以上的flume版本才有,之前的版本需要自定义sink。...

loh4j整合flume(log4jsource)

让log4j产生的日志文件大道flume中,这里log4j需要使用一个flume的appender。

Kafka的通讯协议

本文转载自csdn,感谢博主,还没经得博主同意就私自拿来了,不知会不会出什么差子!为了便于理解,在博主文章基础上加了一张图,本篇主要讲kafka通讯协议中的request、respose的结构,messa...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部