文档章节

hadoop mapper reducer sample demo

Heinrich_Chen
 Heinrich_Chen
发布于 2017/05/27 13:05
字数 245
阅读 16
收藏 0
package com.traveller.bumble.hadoop.mr.temperature;

import com.traveller.bumble.hadoop.mr.wordcount.WordCountMapper;
import com.traveller.bumble.hadoop.mr.wordcount.WordCountReducer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

import java.io.File;
import java.io.IOException;

/**
 * Created by macbook on 2017/5/23.
 */
public class TemperatureApp {

    public static void main(String[] args) {


        try {

            String srcPath = args[0];
            String destPath = args[1];
            String isLocal = args[2];
            boolean flag = false;
            //本地模式
            if (isLocal.equals("1")) {
                File file = new File(destPath);
                flag = deleteDir(file);
                //集群模式
            } else {

                flag = deletePath(new Path(destPath));

            }


            System.out.println(flag);
            Job job = Job.getInstance();
            job.setJobName("temperature");
            job.setJarByClass(TemperatureApp.class);

            job.setNumReduceTasks(1);

            FileInputFormat.addInputPath(job, new Path(srcPath));
            FileOutputFormat.setOutputPath(job, new Path(destPath));
            job.setMapperClass(TemperatureMapper.class);
            job.setReducerClass(TemperatureReducer.class);

            job.setOutputKeyClass(IntWritable.class);
            job.setMapOutputValueClass(IntWritable.class);
            job.waitForCompletion(true);

        } catch (Exception e) {
            e.printStackTrace();
        }

    }



    private static boolean deletePath(Path path) {
        try {
            Configuration conf = new Configuration();
            FileSystem fs = FileSystem.get(conf);
            boolean flag = fs.deleteOnExit(path);
            return flag;
        } catch (IOException e) {
            e.printStackTrace();
            return false;
        }
    }

    private static boolean deleteDir(File dir) {
        if (dir.isDirectory()) {
            String[] children = dir.list();
            for (int i = 0; i < children.length; i++) {
                boolean success = deleteDir(new File(dir, children[i]));
                if (!success) {
                    return false;
                }
            }
        }
        return dir.delete();
    }
}

 

 

mapper

package com.traveller.bumble.hadoop.mr.temperature;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/**
 * Created by macbook on 2017/5/24.
 */
public class TemperatureMapper extends Mapper<LongWritable,Text,IntWritable,IntWritable> {

    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String [] strs = value.toString().split(",");
        IntWritable year = new IntWritable(Integer.valueOf(strs[0]));
        IntWritable temprature = new IntWritable(Integer.valueOf(strs[1]));
        context.write(year,temprature);

    }
}

reducer

© 著作权归作者所有

Heinrich_Chen
粉丝 14
博文 41
码字总数 39863
作品 0
杭州
高级程序员
私信 提问
hadoop-streaming 例子

Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如: 采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,...

cookqq
2014/01/04
260
0
用PHP编写Hadoop的MapReduce程序

目录(?)[+] Hadoop流 虽然Hadoop是用java写的,但是Hadoop提供了Hadoop流,Hadoop流提供一个API, 允许用户使用任何语言编写map函数和reduce函数. Hadoop流动关键是,它使用UNIX标准流作为程序...

bengozhong
2016/02/26
42
0
用python写MapReduce函数——以WordCount为例

阅读目录 1. Python MapReduce 代码 2. 在Hadoop上运行python代码 3. 利用python的迭代器和生成器优化Mapper 和 Reducer代码 4. 参考 尽管Hadoop框架是用java写的,但是Hadoop程序不限于jav...

技术mix呢
2017/10/18
0
0
来自eBay:Hadoop Job成功率达99.9%的优化实战

作者介绍 eBay的CAL(Central Application Logging)系统负责收集eBay各种应用程序的日志数据,并且通过Hadoop MapReduce job生成日志报告,应用程序开发人员与运维人员通过报告可获得以下内...

李万雪
03/28
0
0
Hadoop示例程序WordCount运行及详解

最近在学习云计算,研究Haddop框架,费了一整天时间将Hadoop在Linux下完全运行起来,看到官方的map-reduce的demo程序WordCount,仔细研究了一下,算做入门了。 运行方法: 假设: /home/cq/w...

dreaminthewind
2013/09/09
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周一乱弹 —— 人生,还真是到处是意外

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @这次装个文艺青年吧 :#今日歌曲推荐# 分享lil peep的单曲《High School》 《High School》- lil peep 手机党少年们想听歌,请使劲儿戳(这里...

小小编辑
28分钟前
3
0
Spring使用ThreadPoolTaskExecutor自定义线程池及实现异步调用

多线程一直是工作或面试过程中的高频知识点,今天给大家分享一下使用 ThreadPoolTaskExecutor 来自定义线程池和实现异步调用多线程。 一、ThreadPoolTaskExecutor 本文采用 Executors 的工厂...

CREATE_17
今天
6
0
CSS盒子模型

CSS盒子模型 组成: content --> padding --> border --> margin 像现实生活中的快递: 物品 --> 填充物 --> 包装盒 --> 盒子与盒子之间的间距 content :width、height组成的 内容区域 padd......

studywin
今天
7
0
修复Win10下开始菜单、设置等系统软件无法打开的问题

因为各种各样的原因导致系统文件丢失、损坏、被修改,而造成win10的开始菜单、设置等系统软件无法打开的情况,可以尝试如下方法解决 此方法只在部分情况下有效,但值得一试 用Windows键+R打开...

locbytes
昨天
8
0
jquery 添加和删除节点

本文转载于:专业的前端网站➺jquery 添加和删除节点 // 增加一个三和一节点function addPanel() { // var newPanel = $('.my-panel').clone(true) var newPanel = $(".triple-panel-con......

前端老手
昨天
8
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部