《Hadoop大明白》【2】pyspark的应用场景

原创
2018/11/28 20:08
阅读数 201

1,python的码农涉猎Hadoop,首选pyspark

2,开发spark应用,需要知道的几个点:

【1】SQL语句:insert into / overwirte

【2】DataFrame的常用API

【3】UDF函数

【4】Kafka组件使用

【5】Avro序列化

【6】RDD的坑:谨防嵌套使用
展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部