文档章节

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第三步)(2)

Spark亚太研究院
 Spark亚太研究院
发布于 2014/09/09 12:44
字数 478
阅读 363
收藏 5

3 月,跳不动了?>>>

安装Spark

 

Master、Slave1、Slave2这三台机器上均需要安装Spark。

首先在Master上安装Spark,具体步骤如下:

第一步:把Master上的Spark解压:

我们直接解压到当前目录下:

此时,我们创建Spark的目录“/usr/local/spark”:

把解压后的“spark-1.0.0-bin-hadoop1”复制到/usr/local/spark”下面:

第二步:配置环境变量

       进入配置文件:

在配置文件中加入“SPARK_HOME”并把spark的bin目录加到PATH中:

配置后保存退出,然后使配置生效:

第三步:配置Spark

 

进入Spark的conf目录:

在配置文件中加入“SPARK_HOME”并把spark的bin目录加到PATH中:

把spark-env.sh.template 拷贝到spark-env.sh:

在配置文件中添加如下配置信息:

其中:

JAVA_HOME:指定的是Java的安装目录;

SCALA_HOME:指定的是Scala的安装目录;

SPARK_MASTER_IP:指定的是Spark集群的Master节点的IP地址;

SPARK_WORKER_MEMOERY:指定的Worker节点能够最大分配给Excutors的内存大小,因为我们的三台机器配置都是2g,为了最充分的使用内存,这里设置为了2g;

HADOOP_CONF_DIR:指定的是我们原来的Hadoop集群的配置文件的目录;

 

保存退出。

接下来配置Spark的conf下的slaves文件,把Worker节点都添加进去:

打开后文件的内容:

我们需要把内容修改为:

可以看出我们把三台机器都设置为了Worker节点,也就是我们的主节点即是Master又是Worker节点。

保存退出。

上述就是Master上的Spark的安装。

 

第四步:Slave1和Slave2采用和Master完全一样的Spark安装配置,在此不再赘述。

© 著作权归作者所有

Spark亚太研究院
粉丝 76
博文 73
码字总数 35236
作品 0
朝阳
技术主管
私信 提问
加载中

评论(0)

【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(13)

从控制台可以看到我们的程序成功在集群上运行: Detail for stage 1: Detail for Stage 0: 查看一下Executors的信息: 上述信息表明程序成功在Spark集群上运行。 第四步:基于IDEA构建Spark...

Spark亚太研究院
2014/11/20
295
0
【Spark亚太研究院系列丛书】Spark实战高手之路-第一章 构建Spark集群(第五步)(9)

第二步:构造分布式的Spark1.0.2集群 1,下载Scala 2.10.4,具体下载地址: http://www.scala-lang.org/download/2.10.4.html 在Ubuntu机器上Scala会帮助我们自动选择“scala-2.10.4.tgz”进行...

Spark亚太研究院
2014/11/17
259
0
OSC 第 65 期高手问答 — Spark 企业级实战

OSCHINA 本期高手问答(3月23日-3月29日)我们请来了 @王家林 (王家林)为大家解答关于 Spark 开发方面的问题。 王 家林,Spark 亚太研究院院长和首席专家,当今云计算领域最火爆的技术Docke...

叶秀兰
2015/03/23
6.4K
22
Spark GraphX宝刀出鞘,图文并茂研习图计算秘笈与熟练的掌握Scala语言【大数据Spark

Spark GraphX宝刀出鞘,图文并茂研习图计算秘笈 大数据的概念与应用,正随着智能手机、平板电脑的快速流行而日渐普及,大数据中图的并行化处理一直是一个非常热门的话题。图计算正在被广泛地...

Spark亚太研究院
2014/08/29
1.7K
0
【Spark亚太研究院系列丛书】Spark实战高手之路-第3章Spark架构设计与编程模型第1节②

三、你为什么需要Spark; 你需要Spark的十大理由: 1,Spark是可以革命Hadoop的目前唯一替代者,能够做Hadoop做的一切事情,同时速度比Hadoop快了100倍以上: Logistic regression in Hadoo...

Spark亚太研究院
2014/12/16
461
2

没有更多内容

加载失败,请刷新页面

加载更多

并发编程概念篇-01进程与线程

进程是程序运行资源分配的最小单元 进程是操作系统进行资源分配的最小单元,其中资源包括:CPU,内存空间,磁盘IO等,同一进程中的多条线程共享该进程的全部系统资源,而进程和进程之间是相互...

wangmob
13分钟前
5
0
本科操作系统课练习3(和尚取水问题C++ Windows代码-多线程信号量)

某寺庙,有小和尚、老和尚若干。有一水缸,由小和尚提水入缸,老和尚从缸中取水饮用。水缸可容纳10桶水,水取自同一水井中,水井径窄,每次只能容一个水桶取水。水桶总数为3个,每次入、取缸...

whywhywhywhywhy
昨天
8
0
NAT深入浅出

未完待续,3月31号写完。 引用: NAT的几种类型(https://blog.csdn.net/phoenix06/article/details/70139756) 1. 基础 1.1 作用 1.2 意义 2. NAT种类 2.1 锥型NAT 锥型NAT指:内网同一个ip:...

mr_liang0
昨天
19
0
宜信davinci搭建

下载docker镜像 地址为 https://github.com/edp963/davinci-docker 修改配置信息这里尤其要注意修改邮箱部分 environment: - SERVER_ADDRESS=0.0.0.0 - SPRING_DATASOURCE_UR...

血神龙
昨天
9
0
mysql 5.7.25 解压版安装-整理

下载 mysql 的 解压版安装文件mysql-5.7.25-winx64.zip D:\mysql\master D:\mysql\salve 分别新建 data 和 binlog 目录,以及配置文件 my.ini master 配置文件 [mysqld]# 设置3306端口p...

jxlgzwh
昨天
21
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部