文档章节

Windows系统使用IntelliJ IDEA 搭建Hadoop的开发调试环境(一)

Hi徐敏
 Hi徐敏
发布于 2015/04/14 21:57
字数 743
阅读 586
收藏 1

准备

Hadoop集群

上一篇讲到的Hadoop环境搭建,开启Hadoop几个服务

./sbin/start-dfs.sh 

./sbin/start-yarn.sh 

./sbin/mr-jobhistory-daemon.sh start historyserver

使用jps查看是否执行成功 命令:start-all.sh已经不推荐使用了。

[root@hadoop01 hadoop-2.6.0]# jps
1941 JobHistoryServer
1665 ResourceManager
1355 NameNode
1977 Jps
1497 SecondaryNameNode

IDEA+MAVEN

安装好IDEA,配置好MAVEN即可

WINDOWS系统账号

(同Linux下的Hadoop运行账号,如root)

如果在Windows中,新建一个账号,用户名为root(必须和Hadoop运行的账号一致,比如叫root、hadoop等等)

新建好之后,注销该账号登录的系统即可,不用在该账号下运行。

搭建

Hadoop

如果在调试HDFS功能,拒绝访问,并且在测试环境下,尝试下述做法

1、  调用hdfs无需使用和运行hadoop用户名一致前提,但是需要到hdfs-site.xml中设置permission=false

<configuration>
 <property>
   <name>dfs.namenode.secondary.http-address</name>
     <value>hadoop01:9001</value>
      </property>

  <property>
     <name>dfs.namenode.name.dir</name>
        <value>file:/usr/hadoop-2.6.0/dfs/name</value>
         </property>

 <property>
   <name>dfs.datanode.data.dir</name>
     <value>file:/usr/hadoop-2.6.0/dfs/data</value>
       </property>

 <property>
   <name>dfs.replication</name>
     <value>2</value>
      </property>

 <property>
   <name>dfs.webhdfs.enabled</name>
     <value>true</value>
      </property>
    <property>
      <name>dfs.permissions</name>
      <value>false</value>
    </property>
</configuration>

IDEA工程

新建一个maven工程:hadoop

1、POM依赖

<dependencies>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-common</artifactId>
        <version>2.6.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-hdfs</artifactId>
        <version>2.6.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>2.6.0</version>
    </dependency>
</dependencies>

2、新建一个测试类Test

在hadoop中已经通过执行wordcount导入了input和output的fs文件,这里通过hdfs的api进行调试

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FSDataOutputStream;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IOUtils;

import java.io.InputStream;
import java.net.URI;
/**
 * Created with j360 -> me.h360.hdfs.
 * User: min_xu
 * Date: 2015/4/14
 * Time: 9:05
 * 说明:测试hdfs的文件的情况
 */
public class Test {
    public static void main(String[] args) throws Exception {
        //hdfs的地址
        String uri = "hdfs://192.168.145.128:9000/";
        Configuration config = new Configuration();
        FileSystem fs = FileSystem.get(URI.create(uri), config);

        // 列出hdfs上/tmp/input/目录下的所有文件和目录
        FileStatus[] statuses = fs.listStatus(new Path("/tmp/input"));
        for (FileStatus status : statuses) {
            System.out.println(status);
        }

        // 在hdfs的/tmp/input目录下创建一个文件,并写入一行文本
        FSDataOutputStream os = fs.create(new Path("/tmp/input/test.log"));
        os.write("Hello World!".getBytes());
        os.flush();
        os.close();

        // 显示在hdfs的/tmp/input下指定文件的内容
        InputStream is = fs.open(new Path("/tmp/input/test.log"));
        IOUtils.copyBytes(is, System.out, 1024, true);
    }
}


调试

执行main方法

log4j:WARN No appenders could be found for logger (org.apache.hadoop.metrics2.lib.MutableMetricsFactory).
log4j:WARN Please initialize the log4j system properly.
log4j:WARN See http://logging.apache.org/log4j/1.2/faq.html#noconfig for more info.
FileStatus{path=hdfs://192.168.145.128:9000/tmp/input/f1; isDirectory=false; length=20; replication=2; blocksize=134217728; modification_time=1428671368587; access_time=1428998938744; owner=root; group=supergroup; permission=rw-r--r--; isSymlink=false}
FileStatus{path=hdfs://192.168.145.128:9000/tmp/input/f2; isDirectory=false; length=25; replication=2; blocksize=134217728; modification_time=1428671368663; access_time=1428998938711; owner=root; group=supergroup; permission=rw-r--r--; isSymlink=false}
FileStatus{path=hdfs://192.168.145.128:9000/tmp/input/test.log; isDirectory=false; length=12; replication=3; blocksize=134217728; modification_time=1428991073630; access_time=1428998938072; owner=root; group=supergroup; permission=rw-r--r--; isSymlink=false}
Hello World!
Process finished with exit code 0

已经把前面生成的fs文件打印出来。

© 著作权归作者所有

共有 人打赏支持
Hi徐敏
粉丝 123
博文 40
码字总数 67954
作品 0
静安
架构师
私信 提问
Linux开发环境搭建之Intellij Idea安装配置

本文将会在Linux环境下安装使用Intellij Idea开发工具,然后在Idea中配置Maven和Tomcat,如果还没有Maven环境,可以参考《Linux开发环境搭建之Maven安装配置 》一文。 一、环境准备 1.Linxu桌...

MaxBill
05/14
0
0
Intellij Idea编辑调试Lua

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wwlcsdn000/article/details/80572683 Intellij Idea编辑调试Lua 之前我整理了关于Intellij Idea以及EmmyLua...

那远远的云端
06/04
0
0
从windows10迁移到Linux Deepin

如题, 这几天从windows系统迁移到deepin的linux系统花了很多时间, 以致最近都没时间来博客园。现在将这几天的成果分享出来, 顺便也做个记录。先不多说, 上一张新系统界面。 其实在装deepin之...

qingshanli
07/24
0
0
IntelliJ IDEA下载及安装教程

IntelliJ IDEA下载及安装教程 分步阅读 IntelliJ IDEA是一款功能强大的开发工具,在代码自动提示、重构、J2EE支持、各类版本工具(如git、svn、github)、maven等方面都有很好的应用。Intelli...

我风依旧
09/18
0
0
断网机部署使用idea intellij+sbt+scala

如题,希望在断网机(一下都不能连互联网的)部署使用idea intellij+sbt+scala,遇到了sbt必须联网的问题。我的解决方案是在另一台可以上互联网的机器上(linux),搭建idea intellij+sbt+s...

kaiyuanzhe
2015/01/30
2.7K
1

没有更多内容

加载失败,请刷新页面

加载更多

对接比特币钱包的PHP开发包

BtcTool是一个基于第三方服务和离线裸交易实现的PHP比特币应用开发包,适合不希望部署本地 节点旳PHP开发者,开发包主要包含以下特性: 利用第三方服务获取指定地址的utxo集合 离线生成消费裸...

汇智网教程
28分钟前
1
0
【自用】 VHD to VHDX

VHDX: 在VHD 2TB 的基础上提供 64TB的容量。 支持逻辑扇区大小为 4KB,和每块的大小为 256MB,来优化虚拟磁盘性能。 比VHD提供更高的安全性、可靠性和性能。 convert-VHD –path d:\Hyper-v...

Tensor丨思悟
41分钟前
1
0
30 岁转行做Python开发晚吗?而且是零基础

最近有小伙伴问小编,30 岁转行做Python开发晚吗? 小编想说,其实无论男女,只要想学,有这个动力,就直接去行动。无论年龄,无论性别,只要你想一直勇往直前,那么想做的就去做吧~这里有一...

糖宝lsh
51分钟前
11
0
详解Spring中的Profile

前言 由于在项目中使用Maven打包部署的时候,经常由于配置参数过多(比如Nginx服务器的信息、ZooKeeper的信息、数据库连接、Redis服务器地址等),导致实际现网的配置参数与测试服务器参数混淆...

watermelon11
今天
5
0
phper必知必会(二)

  1.说说你对进程,线程以及协程的理解      进程:是系统进行资源分配和调度的基本单位,是基本操作系统结构的基础。进程是程序基本执行的实体。进程与进程之间是独立的,拥有完全独立...

SEOwhywhy
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部