加载中
hadoop2.7环境的编译安装

海外找回来的的资料,珍惜吧!BD TMD的搜不到,搜到的很多细节漏掉了,总是出错,而且版本很旧,都是1.X的。这里介绍的是目前最新的Hadoop版本2.7.1,但因为还在开发中,应该还不是很稳定,需...

Top Spark Ecosystem Projects(英)

Apache Spark has developed a rich ecosystem, including both official and third party tools. We have a look at 5 third party projects which complement Spark in 5 different ways. ...

2016/03/10 10:39
31
十八款Hadoop工具帮你驯服大数据

由于大数据相关的研究快速发展,有的工具或消失,有的会增强,而新的也会很快出现。这里列出了一些Hadoop相关的工具,仅供参考。

2016/01/05 12:11
324
Spark 学习资源收集

关于Spark的安装、部署、使用的教程、经验和书籍等等的学习资源集合,来自于http://my.oschina.net/leejun2005/blog/311486

2016/05/29 19:05
201
Spark的GPU支持方法研究

本文持续更新中,转载请注明来源:https://my.oschina.net/u/2306127/blog/1602291 为了使用Spark进行机器学习,支持GPU是必须的,上层再运行神经网络引擎。目前AWS\GCP和Databricks的云都已...

iObjects for Spark-时空大数据分析引擎

Apache Spark是功能强大的分布式并行计算平台。iObject for Spark是全球首个面向Spark的时空大数据分析引擎,通过将专业GIS组件引入Spark环境中运行,极大扩充了Spark的能力,使其具备了专业...

开源大数据处理工具汇总(上)

开源大数据处理工具汇总(上),一共81个。

Image Data Support in Apache Spark

Image Data Support in Apache Spark March 5, 2018 by ML Blog Team This post is co-authored by the Microsoft Azure Machine Learning team, in collaboration with Databricks Machine ...

GraphFrames, Spark上的图计算库(英)

An overview of Spark's new GraphFrames, a graph processing library based on DataFrames, built in a collaboration between Databricks, UC Berkeley's AMPLab, and MIT....

在Kubernetes集群中部署ownCloud云盘系统

ownCloud ownCloud is a file sharing server that puts the control and security of your own data back into your hands. 参考 建立自己的共享云盘 - 使用ownCloud 远程访问家里机器的文件...

2018/10/18 08:47
117
NiFi-面向流程的大数据处理框架

任何一个大数据分析的软件,都需要一个强大的数据拉取组件、数据仓储系统、数据处理引擎、任务调度引擎和流程设计界面。Hadoop和Spark的重点是在数据的存储和任务调度,R的重点是数据分析引擎...

Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines

Notebook Workflows: The Easiest Way to Implement Apache Spark Pipelines by Dave Wang, Eric Liang and Maddie Schults Posted in Company Blog August 30, 2016 原文地址: https://da...

Keras+Tensorflow+Jupyter 安装在Docker容器中运行

Keras 安装在Docker容器中运行 将Keras放到Docker+Jupyter中运行,不仅便于安装、兼容性好、容易迁移,而且可以通过Notebook的浏览器界面远程访问。这里介绍将Keras安装在Docker容器中运行的...

2016/09/17 22:21
2.6K
Spark的源码编译

Spark是一个快速发展的用于大量数据处理的分布式系统,这里介绍其源码编译方法。英文好的直接看Spark的版本下载和源码编译方法的官方地址:http://spark.apache.org/downloads.html,最新的信...

2015/12/17 10:08
143
Installing Jenkins on Ubuntu

On Debian-based distributions, such as Ubuntu, you can install Jenkins through apt-get. Recent versions are available in an apt repository. Older but stable LTS versions are in ...

Mesos框架对比:Marathon 和 Aurora

Marathon 和 Aurora 都能在 Mesos 集群上调度和运行常驻服务。本文比较了两个框架的不同和优劣。 问题 Marathon 框架和 Aurora 框架都能在 Mesos 集群上调度和运行常驻服务。我的问题是: 两...

Spark SQL和DataFrame指南[中英对照]

关于Spark SQL和DataFrame的使用指南[中英对照]。

2016/05/29 19:02
203
Airflow在Kubernetes上的操作器

Airflow在Kubernetes (第一部分): 一种不同类型的Operator 作者: Daniel Imberman (Bloomberg LP) 译者:openthings,2019.02.26. 原文:https://kubernetes.io/blog/2018/06/28/airflow-on-...

2018/07/07 15:49
854
15款开源机器学习软件

15款开源机器学习软件 机器学习是目前最热门的科研领域之一。诸如IBM、谷歌、微软、脸书和亚马逊这类大型公司不仅加大了对旗下发展研究部门的资金投入,同时也开始并购一些在机器学习、神经网...

iObjects for Spark- Docker安装攻略

iObjects for Spark时空大数据分析引擎可以帮助使用者进行高效的时空大数据分析,它既可以作为Apache Spark项目在时空数据领域的扩展模块,为软件开发人员服务,也可以作为一个开箱即用的时空...

没有更多内容

加载失败,请刷新页面

返回顶部
顶部