加载中
Scala构建工具(SBT)教程

我们使用 sbt 创建、测试、运行和提交作业。该教程会解释你在我们的课程中将会用到的所有 sbt 命令。工具安装页说明了如何安装 sbt。 启动 sbt 要启动 sbt,打开一个终端(Windows 中的”命令...

2015/12/24 11:10
2.7K
关于Scala和面向对象的函数式编程

这是一个很好的Scala的入门介绍,原文:http://my.oschina.net/mup/blog/363436 定义 Scala语言是一种面向对象语言,同时又结合了命令式(imperative)和函数式(functional)编程风格。官网...

2015/01/13 11:49
82
Jupyter Notebook Python, Scala, R, Spark, Mesos

在Docker中运行Jupyter/Spark/Mesos服务,支持Jupyter Notebook Python, Scala, R, Spark, Mesos Stack。

Spark 学习资源收集

关于Spark的安装、部署、使用的教程、经验和书籍等等的学习资源集合,来自于http://my.oschina.net/leejun2005/blog/311486

2016/05/29 19:05
500
Spark 1.2 发布,开源集群计算系统

Spark 1.2 发布,此版本包括 172 位贡献者和超过 1000 个 commits。 此版本包括 Spark 核心操作和性能改进; 添加新的网络传输子系统,进行了较大的改进; Spark SQL 引入了一个外部数据源的...

2015/01/20 20:43
62
Keras+Tensorflow+Jupyter 安装在Docker容器中运行

Keras 安装在Docker容器中运行 将Keras放到Docker+Jupyter中运行,不仅便于安装、兼容性好、容易迁移,而且可以通过Notebook的浏览器界面远程访问。这里介绍将Keras安装在Docker容器中运行的...

2016/09/17 22:21
1.4W
Spark运行环境的安装

Spark功能还是蛮强的,安装的东西可是不少,好在搞完一次就可以一直用(除非用不上)。这里介绍安装需要的软件和步骤。不同机器可能还有些设置不一样的,需要自己去摸索,毕竟这个是开源软件...

2015/06/25 13:47
981
Spark编程指南《Spark 官方文档》

Spark编程指南《Spark 官方文档》,中文翻译,后面包含一些深度使用的方法。

Spark的python编程-初步理解

spark应用程序结构 Spark应用程序可分两部分:driver部分和executor部分初始化SparkContext和主体程序。 A:driver部分 driver部分主要是对SparkContext进行配置、初始化以及关闭。初始化Spa...

2016/03/03 09:09
4K
PySpark-使用Python在Spark上编程

The Spark Python API (PySpark) exposes the Spark programming model to Python. To learn the basics of Spark, we recommend reading through theScala programming guide first; it sho...

Spark快速入门

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm...

2016/03/12 10:17
322
Spark源码编译和问题的解决

对源码进行编译虽然有点自虐,但可以帮助自己更好地了解其中的细节,为以后的深入和解决配置问题打下基础,否则遇到问题可能会束手无策。这里介绍Spark的编译过程[来自于:http://www.iteb...

2015/12/17 09:06
1.4K
Installing sbt on Linux

sbt是面向scala的build工具,现在Spark也支持sbt build了。怕搞忘了,这里Mark下来,有时间再慢慢翻译。

2015/12/24 11:02
305
Top Spark Ecosystem Projects(英)

Apache Spark has developed a rich ecosystem, including both official and third party tools. We have a look at 5 third party projects which complement Spark in 5 different ways. ...

2016/03/10 10:39
200
Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines

Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines by Dave Wang, Eric Liang and Maddie Schults Posted in Company Blog August 30, 2016 原文地址: https://da...

GraphFrames, Spark上的图计算库(英)

An overview of Spark's new GraphFrames, a graph processing library based on DataFrames, built in a collaboration between Databricks, UC Berkeley's AMPLab, and MIT....

Spark编程指南—Python版

使用Python在Spark上进行数据分析的教程,翻译自Spark(spark.apache.org)的官方文档。

Spark SQL和DataFrame指南[中英对照]

关于Spark SQL和DataFrame的使用指南[中英对照]。

2016/05/29 19:02
325
Spark Streaming 编程指南[中]

Spark Streaming是一个分布式架构的流式数据处理框架。得益于庞大的Hadoop/Spark生态体系,利用RDD的内存迭代计算引入Streaming处理能力,是Spark的一个重要的模块。本Spark Streaming 编程指...

Python的并发编程工具包 Pykka

Pykka 项目的目的是为 Python 提供了易用的并发操作抽象层,使用 Actor 模式。 Pykka 提供了 Actor API ,包含两种不同的实现: ThreadingActor is built on the Python Standard Library’s...

2015/01/26 08:57
1.4K

没有更多内容

加载失败,请刷新页面

返回顶部
顶部