加载中
Spark1.2.1集群环境搭建——Standalone模式

机器准备 笔者有三台机器,左侧栏为ip,右侧为hostname,三台机器都有一个名为spark的用户。 192.168.248.150 spark-master 192.168.248.153 ubuntu-worker 192.168.248.155 spark-worke...

2015/03/16 17:37
9.1K
Spark集群搭建——Hadoop2.4.1集群搭建

安装Java 参见Hadoop 1.2.1 伪分布式模式安装中Java安装部分 配置SSH免密码验证 我们还是以spark-master, ubuntu-worker, spark-worker1三台机器为例。 参见博客Spark集群搭建——SSH免密码验...

2015/03/16 17:16
2.7K
Spark集群搭建——SSH免密码验证登陆

机器准备 笔者有三台机器,左侧栏为ip,右侧为hostname,三台机器都有一个名为spark的用户。通过ping验证三台是可以通信的。 192.168.248.150 spark-master 192.168.248.153 ubuntu-worker...

2015/03/15 20:51
1K
Spark Streaming初探

Spark Streaming是核心的Spark API的一个扩展,是可伸缩、高吞吐量、容错的实时数据流的流处理框架。

2015/01/23 10:00
488
Spark初探

Spark 基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark 部署在大量廉价硬件之上,形成集群。

2015/01/12 09:54
2K
Scala极速入门

当面向对象遇到函数式编程,这就是Scala。简练的语言描述与简单的例子相辅相成,希望能够对大家学习Scala有所帮助。

2015/01/04 12:01
8.8K
分分钟掌握快速排序(Java / Scala 实现)

不浪费空间、效率还非常高的排序算法——快速排序。

MapReduce统计词语出现次数

找出现频率比较高的词语,首先要有一个支持中文的分词器(IK,庖丁解牛等等),这个问题不大;分词之后呢就要统计词语出现次数,类似于MapReduce程序中WordCount,这可是学习MapReduce的hel...

2014/12/19 17:06
999
Eclipse远程调试Hadoop集群

Eclipse远程调试Hadoop集群。

2014/12/17 21:38
2.7K
Hadoop 1.2.1 伪分布式模式安装

Hadoop 1.2.1 伪分布式模式安装

2014/12/17 18:36
379
设计模式-策略模式

策略模式(Strategy pattern),定义一系列算法,将每一种算法发封装起来可以相互替换使用,策略模式让算法独立于使用它的客户端而独立变化,也就是算法发生变化,不影响客户端的使用。...

2014/12/17 09:17
136
设计模式-适配器模式

适配器模式(Adapter pattern),又叫变压器模式,是将一个类的接口变换成客户端所期待的另一种接口,从而使原本因不匹配而无法一起工作的两个类一起工作。

Maven入门

定义 Ø Maven是一个项目管理工具,它包含了: Ø 一个项目对象模型 (Project Object Model), Ø 一组标准集合, Ø 一个项目生命周期(Project Lifecycle), Ø 一个依赖管理系统(Dependen...

2014/12/15 12:15
158
HBase中的基本概念

HBase是Google Bigtable的开源实现。HBase是一个开源的、分布式的、多版本的、面向列的存储模型。HBase利用HDFS作为其文件系统(或本地),还可以通过MapReduce计算模型来并行处理大数据。下...

2014/12/15 08:05
114
Linux中的常用命令

Linux中的常用命令

2014/12/15 08:15
200
UML类图几种关系的总结

在UML类图中,常见的有以下几种关系:泛化(Generalization), 实现(Realization),关联(Association),聚合(Aggregation),组合(Composition),依赖(Dependency)...

2014/12/14 11:48
210
JVM内存分区

JVM内存包含以下分区:程序计数器、JVM栈、本地方法栈、堆、方法区。

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部