文档章节

Hadoop HA

老佛爷
 老佛爷
发布于 2017/07/30 16:14
字数 633
阅读 9
收藏 0

一、配置HADOOP 

(1)、core-site.xml

<configuration>  
    <!-- 指定hdfs的nameservice为nameserver1 -->  
    <property>  
        <name>fs.defaultFS</name>  
        <value>hdfs://nameserver1/</value>  
    </property>  
    <!-- 指定hadoop临时目录 -->  
    <property>  
        <name>hadoop.tmp.dir</name>  
        <value>/home/hadoop/hadoop/data/tmp</value>  
    </property>  
    <!-- 指定zookeeper地址 -->  
    <property>  
        <name>ha.zookeeper.quorum</name>  
        <value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>  
    </property>  
</configuration> 

(2)、hdfs-site.xml

<configuration>  
    <!--指定hdfs的nameservice为nameserver1,需要和core-site.xml中的保持一致 -->  
    <property>  
        <name>dfs.nameservices</name>  
        <value>nameserver1</value>  
    </property>  
    <!-- nameserver1下面有两个NameNode,分别是nn1,nn2 -->  
    <property>  
        <name>dfs.ha.namenodes.nameserver1</name>  
        <value>nn1,nn2</value>  
    </property>  
    <!-- nn1的RPC通信地址 -->  
    <property>  
        <name>dfs.namenode.rpc-address.nameserver1.nn1</name>  
        <value>hadoop1:9000</value>  
    </property>  
    <!-- nn1的http通信地址 -->  
    <property>  
        <name>dfs.namenode.http-address.nameserver1.nn1</name>  
        <value>hadoop1:50070</value>  
    </property>  
    <!-- nn2的RPC通信地址 -->  
    <property>  
        <name>dfs.namenode.rpc-address.nameserver1.nn2</name>  
        <value>hadoop2:9000</value>  
    </property>  
    <!-- nn2的http通信地址 -->  
    <property>  
        <name>dfs.namenode.http-address.nameserver1.nn2</name>  
        <value>hadoop2:50070</value>  
    </property>  
    <!-- 指定NameNode的元数据在JournalNode上的存放位置 -->  
    <property>  
        <name>dfs.namenode.shared.edits.dir</name>  
        <value>qjournal://hadoop1:8485;hadoop2:8485;hadoop3:8485/nameserver1</value>  
    </property>  
    <!-- 指定JournalNode在本地磁盘存放数据的位置 -->  
    <property>  
        <name>dfs.journalnode.edits.dir</name>  
        <value>/home/hadoop/hadoop/data/journaldata</value>  
    </property>  
    <!-- 开启NameNode失败自动切换 -->  
    <property>  
        <name>dfs.ha.automatic-failover.enabled</name>  
        <value>true</value>  
    </property>  
    <!-- 配置失败自动切换实现方式 -->  
    <property>  
        <name>dfs.client.failover.proxy.provider.nameserver1</name>  
        <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>  
    </property>  
    <!-- 配置隔离机制方法,多个机制用换行分割,即每个机制占用一行-->  
    <property>  
        <name>dfs.ha.fencing.methods</name>  
        <value>  
            sshfence  
            shell(/bin/true)  
        </value>  
    </property>  
    <!-- 使用sshfence隔离机制时需要ssh免登陆 -->  
    <property>  
        <name>dfs.ha.fencing.ssh.private-key-files</name>  
        <value>/home/hadoop/.ssh/id_rsa</value>  
    </property>  
    <!-- 配置sshfence隔离机制超时时间 -->  
    <property>  
        <name>dfs.ha.fencing.ssh.connect-timeout</name>  
        <value>30000</value>  
    </property>  
</configuration>  

JournalNode不要和NameNode在一个节点上

(3)、mapred-site.xml

<configuration>  
    <!-- 指定mr框架为yarn方式 -->  
    <property>  
        <name>mapreduce.framework.name</name>  
        <value>yarn</value>  
    </property>  
</configuration>  

(4)、yarn-site.xml

<configuration>  
    <!-- 开启RM高可用 -->  
    <property>  
       <name>yarn.resourcemanager.ha.enabled</name>  
       <value>true</value>  
    </property>  
    <!-- 指定RM的cluster id -->  
    <property>  
       <name>yarn.resourcemanager.cluster-id</name>  
       <value>yrc</value>  
    </property>  
    <!-- 指定RM的名字 -->  
    <property>  
       <name>yarn.resourcemanager.ha.rm-ids</name>  
       <value>rm1,rm2</value>  
    </property>  
    <!-- 分别指定RM的地址 -->  
    <property>  
       <name>yarn.resourcemanager.hostname.rm1</name>  
       <value>hadoop1</value>  
    </property>  
    <property>  
       <name>yarn.resourcemanager.hostname.rm2</name>  
       <value>hadoop2</value>  
    </property>  
    <!-- 指定zk集群地址 -->  
    <property>  
       <name>yarn.resourcemanager.zk-address</name>  
       <value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>  
    </property>  
    <property>  
       <name>yarn.nodemanager.aux-services</name>  
       <value>mapreduce_shuffle</value>  
    </property>  
</configuration>  

二、启动集群

(1)、启动journalnode(分别在hadoop1、hadoop2、hadoop3上启动journalnode)注意只有第一次需要这么启动,之后启动hdfs会包含journalnode。

hadoop-daemon.sh start journalnode 

每个journalnode都需要启动

(2)、格式化HDFS(在hadoop1上执行)

hdfs namenode -format

(3)、格式化ZKFC(在hadoop1上执行)

hdfs zkfc -formatZK  

(4)、启动HDFS(在hadoop1上执行)

start-dfs.sh   

(5)、启动YARN(在hadoop1上执行)

start-yarn.sh  

 

note:hadoop2的resourcemanager(备用节点)需要手动单独启动:

1.hadoop2的resourcemanager、namenode需要手动单独启动:

hadoop-daemon.sh start namenode
yarn-daemon.sh start resourcemanager

2.NN 由standby转化成active

hdfs haadmin -transitionToActive nn1 --forcemanual

 

© 著作权归作者所有

共有 人打赏支持
老佛爷
粉丝 6
博文 75
码字总数 60895
作品 0
上海
后端工程师
私信 提问
hadoop2.x的配置二

三、yarn-site.xml 1.ResourceManager的配置,参考:Hadoop YARN配置参数剖析(1)—RM与NM相关参数 !yarn.resourcemanager.ha.enabled=false。 非YARN HA使用默认配置 YARN HA使用如下配置 ...

cjun1990
2015/08/24
817
0
Hadoop-2.6.0集群搭建(多机环境HDFS HA+YARN HA,推荐)

搭建 HDFS HA 和 ResourceManager HA 集群 下载Hadoop: http://hadoop.apache.org/releases.html 集群规划 HDFS HA说明 Hadoop 2.x中通常由两个NameNode组成,一个处于Active状态,另一个处...

翻船全靠浪
2016/04/25
66
0
Hadoop手把手逐级搭建,从单机伪分布到高可用+联邦(4)Hadoop高可用+联邦(HA+Federation)

第四阶段: Hadoop高可用+联邦(HA+Federation) 0. 步骤概述 1. 为高可用保存hadoop配置 1.1 进入$HADOOP_HOME/etc/目录 1.2 备份hadoop高可用配置,供以后使用 1.3 查看$HADOOP_HOME/etc/目录...

bigablecat
01/05
0
0
Spring Hadoop Yarn HA问题调研

Spring Hadoop Yarn HA问题调研 OneCoder2017-03-2461 阅读 Hadoop Spring XD on Yarn在使用过程中发现不论是YarnClient还是AppMaster对Yarn HA的支持都不好。在Yarn的RM重启或切换的情况下,...

OneCoder
2017/03/24
0
0
Hadoop 2.0中单点故障解决方案总结

项目构建 Hadoop 1.0内核主要由两个分支组成:MapReduce和HDFS,众所周知,这两个系统的设计缺陷是单点故障,即MR的JobTracker和HDFS的NameNode两个核心服务均存在单点问题,该问题在很长时间...

jackwxh
06/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

java框架学习日志-7(静态代理和JDK代理)

静态代理 我们平时去餐厅吃饭,不是直接告诉厨师做什么菜的,而是先告诉服务员点什么菜,然后由服务员传到给厨师,相当于服务员是厨师的代理,我们通过代理让厨师炒菜,这就是代理模式。代理...

白话
34分钟前
5
0
Flink Window

1.Flink窗口 Window Assigner分配器。 窗口可以是时间驱动的(Time Window,例如:每30秒钟),也可以是数据驱动的(Count Window,例如:每一百个元素)。 一种经典的窗口分类可以分成: 翻...

满小茂
35分钟前
3
0
my.ini

1

architect刘源源
51分钟前
4
0
docker dns

There is a opensource application that solves this issue, it's called DNS Proxy Server It's a DNS server that solves containers hostnames, if could not found a hostname that mat......

kut
今天
5
0
寻找数学的广度——《这才是数学》读书笔记2700字

寻找数学的广度——《这才是数学》读书笔记2700字: 文|程哲。数学学习方式之广:国内外数学教育方面的专家,进行了很多种不同的数学学习方式尝试,如数学绘本、数学游戏、数学实验、数学步道...

原创小博客
今天
11
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部