文档章节

hadoop2.5.1安装到虚拟机

暗夜孤灯
 暗夜孤灯
发布于 2014/12/01 17:26
字数 1067
阅读 480
收藏 18
1.虚拟机安装
系统版本 RHEL6.3

2.虚拟机ip配置
采用 共享方式(nat) : 
默认:
使用vmnet8 将虚拟机设置成使用dhcp方式上网,windows下选择"自动获取ip",linux下开启dhcp服务即可。 
手动设置: 
ip设置与vmnet8同网段, 
网关设置成vmnet8的网关, 
DNS服务器设置与主机相同, 
实现虚拟机<--->主机虚拟机<---->互联网 通信。

vim /etc/sysconfig/network-scripts/ifcfg-eth0
......
BOOTPROTO=static
ONBOOT="yes"
IPADDR=192.168.234.100 --设置为网关同ip段
NETMASK=255.255.255.0
GATEWAY=192.168.234.2-- vmnet8的网关
......
最后不要忘了设置DNS  echo "nameserver 8.8.8.8" >> /etc/resolv.conf
重启reboot

设置好了就可以用SecureCRT查看了,并且能够ping通外网

yum源配置
查看文档  使用CentOS的yum源进行升级或软件安装 

rpm -qa |grep yum 查看yum安装情况
rpm -qa |grep yum | xargs rpm -e --nodeps 卸载rhel原有yum

安装yum软件包 
1. #rpm -ivh python-iniparse-0.3.1-2.1.el6.noarch.rpm 2. # rpm -ivh yum-metadata-parser-1.1.2-16.el6.x86_64.rpm 
3. #rpm -ivh yum-3.2.29-30.el6.centos.noarch.rpm yum-plugin-fastestmirror-1.1.3 0-14.el6.noarch.rpm 

由于centos官网6.3版的不再更新且文件不存在,所以选用的是 centos官网 6.5版本的yum相关包
同时下载163的仓库, http://mirrors.163.com/.help/CentOS6-Base-163.repo 修改$releaseser为6.5
删除/etc/yum.repos.d/rhel-source.repo
使用centos-163.repo替换

scp  centos-163.repo  root@192.168.234.112 :/etc/yum.repos.d/

安装rz+sz方便上传下载文件到本地
yum -y install lrzsz 

传输所有的依赖文件到其他服务器
scp -r dep   root@192.168.234.112 :/home/hadoop/

安装java,并配置环境变量
java -version 查看现有java版本

rpm -qa|grep java 查看java安装包
rpm -qa|grep java | xargs rpm -e --nodeps   卸载java安装包

vim /etc/profile 添加java环境变量配置
#set java path
JAVA_HOME=/usr/java/jdk1.7.0_45
JRE_HOME=/usr/java/jdk1.7.0_45/jre
PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

source /etc/profile 应用配置
其他机器使用相同配置
scp /etc/profile root@192.168.234.112:/etc/profile

配置host
192.168.234.114  namenode
192.168.234.111 datanode1
192.168.234.112 datanode2
192.168.234.113 datanode3 
其他namenode和datanode配置一样
scp /etc/hosts root@192.168.234.112:/etc/hosts


ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

scp到datanode

安装hadoop
tar -xvf dep/hadoop/hadoop-2.5.1.tar.gz

配置hadoop

/home/hadoop/hadoop-2.5.1/etc/hadoop中的slaves文件添加数据节点
datanode1
datanode2
datanode3

配置hostname
格式化namenode报错处理方法

/etc/sysconfig/network  中的hostname修改掉,并重启网络服务生效
service network restart

格式化文件系统
bin/hdfs namenode -format

http://192.168.234.114:50070/ 一定要记得关闭namenode的防火墙,否则访问不了
service iptables stop/status


但启动./start-dfs.sh一直会有个警告
WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Starting namenodes on [namenode]

hadoop fs -mkdir /input命令报错

开启debug模式
export HADOOP_ROOT_LOGGER=DEBUG,console

可以看到是因为glibc版本太低的原因

有两种解决方法
1.在glibc2.12环境下重新编译hadoop
2.安装glibc2.14或以上版本

这里我采用第二种
升级glibc到2.14以上, 升级前 千万 不要卸载 glibc ,卸载后所有命令都失效了, 重启还报错
kernel panic - not attempted to kill init, 害得我只能重装系统了,又搞了半天
重装namenode之后, 从datanode传 hadoop 过去
格式化文件系统后重启,否则会找不到数据节点

1. 下载 
glibc-2.15-60.el6.x86_64.rpm 
glibc-common-2.15-60.el6.x86_64.rpm
安装
rpm -ivh glibc-2.15-60.el6.x86_64.rpm glibc-common-2.15-60.el6.x86_64.rpm --replacefiles
不加 --replacefiles会报文件冲突的错

重新运行./start-dfs.sh,不再报警了

hadoop fs -mkdir /input 创建文件夹
hadoop fs -ls / 展示文件列表

Hadoop报错:NoRouteToHostException: No route to host
关闭datanode数据节点的防火墙

测试mapreduce
创建文件夹input,创建测试文件test1,test2
mkdir input && cd input
echo "a b c d e" > test1
echo "a b c d f" > test2
hadoop fs -put input /

可以看到已经加入hdfs中

运行WordCount
cd /home/hadoop/hadoop-2.5.1/share/hadoop/mapreduce
hadoop jar hadoop-mapreduce-examples-2.5.1.jar wordcount /input /output

自己打的包
hadoop jar wordct.jar org.WordCount /input /output

hadoop fs -cat /output/part-r-00000



© 著作权归作者所有

共有 人打赏支持
暗夜孤灯
粉丝 3
博文 10
码字总数 5943
作品 0
抚州
技术主管
centos6.5 64位下编译hadoop2.5.1源码

需要的工具:centos6.5 -64bit jdk1.7.0.71 maven3.23 (http://mirrors.cnnic.cn/apache/maven/maven-3/3.2.3/binaries/apache-maven-3.2.3-bin.tar.gz) ant1.9 (http://mirrors.cnnic.cn......

逸风如梦
2014/11/15
0
0
hadoop的安装与配置

Hadoop版本 Hadoop 有两个主要版本,Hadoop 1.x.y 和 Hadoop 2.x.y 系列.1.x.y大数公司已经更新Hadoop 2.x 版本,本教程均可适用. 基本环境:Centos 6.5 jdk1.7.0_67 hadoop2.5.1 一、配置jdk...

ictedu
2017/04/18
0
0
Nutch1.7结合Hadoop2.5.1的分布式爬取全攻略

Hadoop 2.5.1可执行文件及集群搭建 集群安装:http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/ClusterSetup.html【安装Hadoop集群】 http://blog.csdn.net/jiuti......

强子哥哥
2014/09/22
0
0
大数据之Hadoop平台(二)Centos6.5(64bit)Hadoop2.5.1伪分布式安装记录,wordcount运行测试

注意:以下安装步骤在Centos6.5操作系统中进行,安装步骤同样适于其他操作系统,如有同学使用Ubuntu等其他Linux操作系统,只需注意个别命令略有不同。 注意一下不同用户权限的操作,比如关闭...

chaun
2015/04/14
0
0
linux 下的KVM 虚拟机

linux 下的kvm的使用 cpu开启VT 安装kvm套件 添加br0桥接网口 创建虚拟机磁盘,或者在安装虚拟机的时候创建该磁盘。 安装虚拟机 使用虚拟机 使用安装的虚拟机磁盘做原始镜像来启动新的虚拟机...

ting2junshui
07/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

javascript source map 的使用

之前发现VS.NET会为压缩的js文添加一个与文件名同名的.map文件,一直没有搞懂他是用来做什么的,直接删除掉运行时浏览器又会报错,后来google了一直才真正搞懂了这个小小的map文件背后的巨大...

粒子数反转
昨天
0
0
谈谈如何学Linux和它在如今社会的影响

昨天,还在农耕脑力社会,今天已经人工智能技术、大数据、信息技术的科技社会了,高速开展并迅速浸透到当今科技社会的各个方面,Linux日益成为人们信息时代的到来,更加考验我们对信息的处理程...

linux-tao
昨天
0
0
学习设计模式——中介者模式

1. 认识中介者模式 1. 定义:用一个中介对象来封装一系列的对象交互行为,中介者使得各对象不需要显式的互相引用,从而使其松散耦合,独立的改变他们之间的交互。 2. 结构: Mediator:中介者...

江左煤郎
昨天
0
0
深入理解Plasma(1):Plasma 框架

这一系列文章将围绕以太坊的二层扩容框架,介绍其基本运行原理,具体操作细节,安全性讨论以及未来研究方向等。本篇文章作为开篇,主要目的是理解 Plasma 框架。 Plasma 作为以太坊的二层扩容...

HiBlock
昨天
0
0
Java 8 日期 示例

Java 8 推出了全新的日期时间API。Java处理日期、日历和时间的方式一直为社区所诟病,将 java.util.Date设定为可变类型,以及SimpleDateFormat的非线程安全使其应用非常受限。Java也意识到需...

阿刚ABC
昨天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部