加载中
Hadoop之分布式存储HDFS和离线计算MapReduce

本文介绍了Hadoop生态系统及其hdfs架构原理和mapreduce原理

Kettle基础使用

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户...

2017/05/22 18:02
204
Spark认知

一、Spark体系结构 Spark是一种基于内存的开源计算框架,不同于Hadoop的MapReduce和HDFS,Spark主要包括Spark Core和在Spark Core基础之上建立的应用框架Spark SQL、Spark Streaming、MLlib...

2017/11/29 18:30
342
MySQL双机热备

1.MySQL双机热备原理 双机热备就是使用MySQL提供的一种主从备份机制实现。所谓双机热备其实是一个复制的过程,复制过程中一个服务器充当主服务器,一个或多个服务器充当从服务。这个复制的过...

2018/08/08 14:19
344
Spark2.2.0 分布式离线搭建

1、Spark简介 Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spa...

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部