加载中
R语言与Hadoop和Hbase的联合使用

HBase和rhbase的安装与使用,包括:环境准备及HBase安装,rhbase安装,rhbase程序用例。

Spark大数据分析框架的核心部件

Spark大数据分析框架的核心部件包含RDD内存数据结构、Streaming流计算框架、GraphX图计算与网状数据挖掘、MLlib机器学习支持框架、Spark SQL数据检索语言、Tachyon文件系统、SparkR计算引擎等...

关于Spark的基本概念和特性简介

Spark是近年来发展较快的分布式并行数据处理框架,可以与Hadoop联合使用,增强Hadoop的性能。同时,Spark还增加了内存缓存、流数据处理、图数据处理等更为高级的数据处理能力。这里简单介绍了...

Airflow在Kubernetes上的操作器

Airflow在Kubernetes (第一部分): 一种不同类型的Operator 作者: Daniel Imberman (Bloomberg LP) 译者:openthings,2019.02.26. 原文:https://kubernetes.io/blog/2018/06/28/airflow-on-...

2018/07/07 15:49
586
十八款Hadoop工具帮你驯服大数据

由于大数据相关的研究快速发展,有的工具或消失,有的会增强,而新的也会很快出现。这里列出了一些Hadoop相关的工具,仅供参考。

2016/01/05 12:11
323
开源大数据处理工具汇总(上)

开源大数据处理工具汇总(上),一共81个。

Spark的Python编程-简单示例

Spark安装后,自带了一些demo, 路径在Spark根目录/examples/src/main/python/。这里是一个简单的介绍。

2016/03/02 07:56
3K
Spark的Python编程-初步入门

Spark提供了Python脚本编程接口,这里简单介绍其使用。

2016/03/02 07:53
497
Spark的python编程-初步理解

spark应用程序结构 Spark应用程序可分两部分:driver部分和executor部分初始化SparkContext和主体程序。 A:driver部分 driver部分主要是对SparkContext进行配置、初始化以及关闭。初始化Spa...

2016/03/03 09:09
1K
Spark编程指南—Python版

使用Python在Spark上进行数据分析的教程,翻译自Spark(spark.apache.org)的官方文档。

开源大数据处理工具汇总(下)

开源大数据处理工具汇总(下),第二部分主要收集整理的内容主要有日志收集系统、消息系统、分布式服务、集群管理、RPC、基础设施、搜索引擎、Iaas和监控管理等大数据开源工具。

Spark快速入门

什么是Spark Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。 与Hadoop和Storm...

2016/03/12 10:17
207
Spark编程指南《Spark 官方文档》

Spark编程指南《Spark 官方文档》,中文翻译,后面包含一些深度使用的方法。

CG_Hadoop:基于MapReduce的计算几何

摘要:Hadoop使用了MapReduce编程范式,目前已经被公认为是分布 式环境中分析大数据的标准框架。然而,它并不能很好的应用于大规模的计算几何处理。本文介绍的CG_Hadoop是一套可伸缩的和高效...

Python支持库大全

Awesome Python A curated list of awesome Python frameworks, libraries and software. Inspired by awesome-php. Awesome Python Environment Management    环境管理 Package Manageme...

2016/03/17 16:12
982

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部