加载中
Hadoop之分布式存储HDFS和离线计算MapReduce

本文介绍了Hadoop生态系统及其hdfs架构原理和mapreduce原理

Spark2.2.0 分布式离线搭建

1、Spark简介 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spa...

Spark认知

一、Spark体系结构 Spark是一种基于内存的开源计算框架,不同于Hadoop的MapReduce和HDFS,Spark主要包括Spark Core和在Spark Core基础之上建立的应用框架Spark SQL、Spark Streaming、MLlib...

2017/11/29 18:30
342
Kettle基础使用

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户...

2017/05/22 18:02
204
ElasticSearch5.4.3离线搭建

1、ElasticSearch简介 ElasticSearch 是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch 是用Java开发的,并作为Apache许可条...

2018/04/24 17:14
869
Linux学习分享(一)

最近,想总结一下之前学习过的Linux的一些命令和基础,顺便分享给各位,不喜勿喷。如若其中有些地方存有争议,请点击右上角联系管理员进行修改,毕竟每个人可能理解的方式不一样。 工具准备 ...

关于Greenplum的那点事儿

Greenplum是什么鬼?干啥用的?能吃吗? 下面是来自官网的一段英文: 大概翻译一下: Greenplum Database是一个大规模并行处理(MPP)数据库服务器,其架构专门用于管理大规模分析数据仓库和...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部