文档章节

【大数据分析常用算法】0.简介

Areya
 Areya
发布于 01/14 16:32
字数 220
阅读 63
收藏 0

简介

本系列教程主要探讨有关大数据的所有常用算法的实现,定期加入有趣的项目实践。

1、实现语言

初步使用java实现,后续加入python。

  • Hadoop Mapreduce Java实现 位于包*.mapreduce下。
  • Spark MapReduce Java实现 位于包*.spark下。

python实现会在以后加入。

每个算法存在一个模块,测试文件位置父模块根目录下,对应名字可从系列教程里面找到。

2、实现框架

  • Hadoop 2.7.3
  • Spark 2.4

3、参考

  • 书籍《算法实现:Hadoop/spark》

© 著作权归作者所有

Areya
粉丝 28
博文 97
码字总数 167412
作品 0
广州
私信 提问
哈尔滨大数据培训课程哪个好?从内容教你如何判断

导读 随着大数据飞速发展,大数据将对人类生活产生深远影响,大数据是未来科技浪潮发展不容忽视的巨大推动力量,加上人工智能对大数据技术的需要,使越来越多的人想要从事大数据,但却不知道哈...

hxl0009
2018/04/16
0
0
阿里年薪50WJAVA工程师转大数据学习路线!

大数据有两个方向,一个是偏计算机的,另一个是偏经济的。你学过Java,所以你可以偏将计算机的。 Java程序员想转大数据可行吗?Java是全世界使用人数最多的编程语言。不少程序员选择Java做为...

JAVA丶学习
2018/04/25
0
0
如何快速入门机器学习/人工智能?

这几年人工智能、机器学习大热,起步2万+的月薪让很多人心驰神往,很多外行的朋友找到我,认为自己的专业上限不高或者工作内容枯燥前景不好,“我可不可以转机器学习”?为了回答这个问题,我...

菜鸟窝
06/05
0
0
【上海场】中国Python开发者大会PyConChina2017 - 10/22

大会简介 【上海场报名链接】 http://www.huodongxing.com/go/pyconchina2017sh 【杭州场报名链接】 http://www.huodongxing.com/go/pyconchina2017hz 今年,IEEE Spectrum 发布了第四届顶级...

TopGeek
2017/09/21
60
0
【上海场】中国Python开发者大会PyConChina2017 - 10/22

大会简介 【上海场报名链接】 http://www.huodongxing.com/go/pyconchina2017sh 【杭州场报名链接】 http://www.huodongxing.com/go/pyconchina2017hz 今年,IEEE Spectrum 发布了第四届顶级...

TopGeek
2017/09/21
23
0

没有更多内容

加载失败,请刷新页面

加载更多

3_数组

3_数组

行者终成事
22分钟前
3
0
经典系统设计面试题解析:如何设计TinyURL(二)

原文链接:https://www.educative.io/courses/grokking-the-system-design-interview/m2ygV4E81AR 编者注:本文以一道经典的系统设计面试题:《如何设计TinyURL》的参考答案和解析为例,帮助...

APEMESH
今天
7
0
使用logstash同步MySQL数据到ES

概述   在生成业务常有将MySQL数据同步到ES的需求,如果需要很高的定制化,往往需要开发同步程序用于处理数据。但没有特殊业务需求,官方提供的logstash就很有优势了。   在使用logstas...

zxiaofan666
今天
10
0
X-MSG-IM-分布式信令跟踪能力

经过一周多的鏖战, X-MSG-IM的分布式信令跟踪能力已基本具备, 特点是: 实时. 只有要RX/TX就会实时产生信令跟踪事件, 先入kafka, 再入influxdb待查. 同时提供实时sub/pub接口. 完备. 可以完整...

dev5
今天
7
0
OpenJDK之CyclicBarrier

OpenJDK8,本人看的是openJDK。以前就看过,只是经常忘记,所以记录下 图1 CyclicBarrier是Doug Lea在JDK1.5中引入的,作用就不详细描述了,主要有如下俩个方法使用: await()方法,如果当前线...

克虏伯
今天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部