Hadoop热添加删除节点(含Hbase)

2014/07/15 16:06
阅读数 4.2K

添加节点

1.修改host 
  和普通的datanode一样。添加namenode的ip
2.修改namenode的配置文件conf/slaves 
  添加新增节点的ip或host
3.在新节点的机器上,启动服务 

[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode
[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker(hadoop1)
[root@slave-004 hadoop]# ./bin/yarn-daemon.sh start nodemanager(hadoop2)

4.均衡block 

[root@slave-004 hadoop]# ./bin/start-balancer.sh

1)如果不balance,那么cluster会把新的数据都存放在新的node上,这样会降低mapred的工作效率 
2)设置平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长 

[root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5

3)设置balance的带宽(hdfs-site),默认只有1M/s

 
   dfs.balance.bandwidthPerSec  
   1048576  
     
     Specifies the maximum amount of bandwidth that each datanode   
     can utilize for the balancing purpose in term of   
     the number of bytes per second.   
   

注意: 
1. 必须确保slave的firewall已关闭; 
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中,反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中
3.如果start-balancer.sh运行完了仍然没有反应的话,就把-threshold尽量调小,越小越均衡所耗时间也就越小

start-balancer.sh -threshold 1

Hbase

如果还有hbase在上面运行则需要部署hbase的hserver
5.在hbasemaster上修改regionservers
vim /home/hadoop/hbase/conf/regionservers
加入新节点
vim /home/hadoop/hbase/conf/hbase-site.xml
hbase.zookeeper.quorum属性加入新节点
6.复制上面两个文件到各个节点
7.在新节点上启动hbase regionserver
  hbase-daemon.sh start regionserver
8.在hbasemaster启动hbase shell
用status命令确认一下集群情况


删除节点

1.集群配置 
   修改conf/hdfs-site.xml文件

   
   dfs.hosts.exclude  
   /data/soft/hadoop/conf/excludes  
   Names a file that contains a list of hosts that are   
   not permitted to connect to the namenode.  The full pathname of the   
   file must be specified.  If the value is empty, no hosts are   
   excluded.

编辑conf/mapred-site.xml文件,增加如下配置:
<property>
          <name>mapred.hosts.exclude</name>
          <value>/opt/hadoop_conf/exclude_node</value>
</property>

2确定要下架的机器 
dfs.hosts.exclude定义的文件内容为,每个需要下线的机器,一行一个。这个将阻止他们去连接Namenode。如: 

slave-003  
slave-004

  3.强制重新加载配置 

[root@master hadoop]# ./bin/hadoop dfsadmin  -refreshNodes

它会在后台进行Block块的移动
4.关闭节点 
等待刚刚的操作结束后,需要下架的机器就可以安全的关闭了。 

[root@master hadoop]# ./bin/ hadoop dfsadmin -report

可以查看到现在集群上连接的节点

正在执行Decommission,会显示: 
Decommission Status : Decommission in progress  

执行完毕后,会显示: 
Decommission Status : Decommissioned

 5.再次编辑excludes文件 
一旦完成了机器下架,它们就可以从excludes文件移除了 
登录要下架的机器,会发现DataNode进程没有了,但是TaskTracker依然存在,需要手工处理一下


展开阅读全文
打赏
1
5 收藏
分享
加载中
更多评论
打赏
0 评论
5 收藏
1
分享
返回顶部
顶部