文档章节

SUSE上搭建Hadoop环境(单机模式+伪分布模式)

彼得
 彼得
发布于 2014/04/07 00:37
字数 696
阅读 1.6K
收藏 10

【环境】:

经常遭遇因为依赖软件版本不匹配导致的问题,这次大意了,以为java问题不大,就用本来通过yast安装的java1.6 openjdk去搞了,结果可想而知,问题很多,反复定位,反复谷歌百度,最后一朋友启发下决定换换jdk版本。问题解决了,所以这里贴下我的环境

java环境: java version "1.7.0_51"
               Java(TM) SE Runtime Environment (build 1.7.0_51-b13)
               Java HotSpot(TM) 64-Bit Server VM (build 24.51-b03, mixed mode)

系统:       openSUSE 11.2 (x86_64)

hadoop版本Hadoop-1.1.2.tar.gz

【Step1:】创建hadoop用户及用户组

 组:hadoop 

 用户:hadoop  -> /home/hadoop

 加权限: vi /etc/sudoers  增加 hadoop  ALL=(ALL:ALL)  ALL

【Stpe2:】安装hadoop

 笔者tar xf 安装完后是这样的目录结构(供参考):

 /home/hadoop/hadoop-home/[bin|conf]

【Step3:】配SSH(避免启动hadoop时需要密码)

 略安装ssh

 ssh-keygen -t rsa -P "" [一路回车及确认]

 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

 尝试 ssh localhost [检查下是不是不需要密码啦]

【Step4:】安装java

 版本见【环境】部分

【Step5:】配conf/hadoop-env.sh 

export JAVA_HOME=/usr/java/jdk1.7.0_17xxx        #[jdk目录]

export HADOOP_INSTALL=/home/hadoop/hadoop-home          

export PATH=$PATH:$HADOOP_INSTALL/bin        #[这里是hadoop脚本所在目录]

【Step6:】使用单机模式

 hadoop version

mkdir input

 man find > input/test.txt

 hadoop jar hadoop-examples-1.1.2.jar wordcount input output

【Step7:】伪分布模式(单机实现namenode,datanode,tackerd等模块)

 conf/[core-site.xml、hdfs-site.xml、mapred-site.xml]

 core-site.xml

<configuration>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/usr/local/hadoop/tmp</value>
    </property>
</configuration>

hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.name.dir</name>
        <value>/usr/local/hadoop/datalog1,/usr/local/hadoop/datalog2</value>
    </property>
    <prop<configuration>   
    <property>  
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>   
    </property>
</configuration>erty>
        <name>dfs.data.dir</name>
        <value>/usr/local/hadoop/data1,/usr/local/hadoop/data2</value>
    </property>
</configuration>

mapred-site.xml

<configuration>   
    <property>  
        <name>mapred.job.tracker</name>
        <value>localhost:9001</value>   
    </property>
</configuration>

【Step8:】启动

 格式化:hadoop namenode -format

 cd bin

 sh start-all.sh

hadoop@linux-peterguo:~/hadoop-home/bin> sh start-all.sh
starting namenode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-namenode-linux-peterguo.out
localhost: starting datanode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-datanode-linux-peterguo.out
localhost: starting secondarynamenode, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-secondarynamenode-linux-peterguo.out
starting jobtracker, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-jobtracker-linux-peterguo.out
localhost: starting tasktracker, logging to /home/hadoop/hadoop-home/libexec/../logs/hadoop-hadoop-tasktracker-linux-peterguo.out

 jps查看进程是否全启动 五个java进程 jobtracker/tasktracker/namenode/datanode/sencondarynamenode

 可以通过下面的操作来查看服务是否正常,在Hadoop中用于监控集群健康状态的Web界面:
http://localhost:50030/ - Hadoop 管理介面
http://localhost:50060/ - Hadoop Task Tracker 状态
http://localhost:50070/ - Hadoop DFS 状态

【Step9:】操作dfs数据文件

hadoop dfs -mkdir input

hadoop dfs -copyFromLocal input/test.txt input

hadoop dfs -ls input

【Step10:】运行dfs上的mr

hadoop jar hadoop-examples-1.1.2.jar wordcount input output 

hadoop dfs -cat output/*

【Step11:】关闭

stop-all.sh


参考:http://blog.csdn.net/zhaoyl03/article/details/8657104

© 著作权归作者所有

彼得

彼得

粉丝 39
博文 122
码字总数 38726
作品 0
深圳
程序员
私信 提问
SUSE发布全新版本,多模块设计为IT转型赋能

每四年发布一个全新版本,对操作系统进行重大更新,这是SUSE产品的推出节奏。近日,SUSE Linux Enterprise 15正式发布,此版本不仅在功能和技术方面进行了更新,而且采用的全新多模块化设计更...

六库科技
2018/07/07
10
0
SUSE 20周年 Ralf Flaxa眼中的开源世界

  【IT168 评论】如今的开源力量已经渗透到了方方面面,在云计算上,OpenStack几乎成为了这一领域内的标准配置,与此同时,在大数据上,Hadoop让大数据的发展有了更强有力的依托,再回头看...

作者:论坛
2012/11/06
0
0
SUSECon China 2012中国盛会隆重召开

  【IT168 资讯】北京时间11月9日,首次登陆中国的Linux业界盛会SUSECon China 2012在厦门隆重召开。此次盛会上,SUSE联合众多知名厂商及合作伙伴,与中国两岸三地及韩国的用户、专家共同回...

作者:陶然
2012/11/11
0
0
SUSE 推进数字化转型的下一个前沿,云原生开源技术堆栈的商业融合

如今,Kubernetes 在云原生界“走红”,占据了容器集群管理平台的主导市场地位。容器集群管理平台是云原生软件运行的“底座”,自 3 年前 Docker 容器技术涌现出一批公司以来,容器底层的集群...

作者: Suse
2019/11/12
0
0
openSUSE 考虑从 SUSE 公司独立

社区正在考虑将 openSUSE 从 SUSE 公司独立出来,主要关注点是希望 openSUSE 项目在其治理与更广泛社区的互动方面获得更大的自主权。 该问题已经在 openSUSE 讨论了两个多月,并且愈演愈烈,...

h4cd
2019/06/07
3.2K
7

没有更多内容

加载失败,请刷新页面

加载更多

node.js中__dirname和./有什么区别?

在Node.js中编程并引用位于与当前目录相关的文件时,是否有任何理由使用__dirname变量而不仅仅是常规./ ? 到目前为止,我一直在使用./并且刚刚发现了__dirname的存在,并且基本上想知道将....

javail
33分钟前
35
0
Hive安装

下载上传apache-hive-2.1.1-bin.tar.gz文件并解压 tar -zxvf apache-hive-2.1.1-bin.tar.gz -C /export/servers 配置环境变量 vi /etc/profileexport HIVE_HOME=/export/servers/apache......

长臂猿猴
38分钟前
43
0
OS X:相当于Linux的wget

如何从库存OS X系统上的Un * x shell脚本执行HTTP GET? (安装第三方软件不是一种选择,因为这必须在我无法控制的许多不同系统上运行)。 例如,如果我在本地启动Mercurial服务器执行hg服务...

技术盛宴
48分钟前
39
0
Fedora 31 - 荣耀魔法本问题记录

最近荣耀魔法本装了Fedora31系统,没有像Deepin 15.11那样出现亮度不能调节和网卡不能用的问题。但是也有不少小问题: 触摸板有时启动后失效,需要重启。 触摸板的右键失效。 待机后进入桌面...

wffger
52分钟前
34
0
ElasticSearch深入:内部机制浅析(三)@

前言 上篇从分布式的角度阐述了 ES 的分布式设计和思想,这一篇打算与 Lucene 结合起来,摸透一些 ES 的常遇到的概念,我们可以将了解到的这些东西应用到优化实践中去。 一、Shard Shard 实际...

HLee
今天
40
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部