6.4hadoop idea本地运行器测试

1.1  本地运行器进行本地测试

写一个MapReduce驱动程序,执行job,实现tool接口,所以可以通过hadoop的命令行去设置为本地运行模式。实现tool的run函数,在run函数中创建job执行任务,输出结果。

1.1.1         本地任务执行器定义

package Temperature;

import javafx.scene.text.Text;
import org.apache.hadoop.conf.Configured;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.mapred.FileInputFormat;
import org.apache.hadoop.mapred.FileOutputFormat;

import org.apache.hadoop.mapred.JobClient;
import org.apache.hadoop.mapred.JobConf;
import org.apache.hadoop.mapred.jobcontrol.Job;
import org.apache.hadoop.util.Tool;
import org.apache.hadoop.util.ToolRunner;

public class MaxTemperatureDrive
extends Configured implements
Tool {

public int run(String[] var1) throws Exception
    {
        if (var1.length!=2)
        {
            return -1;
        }
        JobConf conf=new JobConf(MaxTemperatureJob.class);//hadoop会根据类名去找jar包
        conf.setJobName("Max temperature");
        FileInputFormat.addInputPath(conf,new Path(var1[0]));//输入文件:单个文件或者目录
        FileOutputFormat.setOutputPath(conf,new Path(var1[1]));//输出路径,hadoop新建,不能存在。避免误覆盖
        conf.setMapperClass(TemperatureMapper.class);
        conf.setReducerClass(MaxTempertureReduce.class);
        conf.setOutputKeyClass(Text.class);//reduce的输出类型,map一致时默认,不一致,map也需要指定
       
conf.setOutputValueClass(IntWritable.class);
        JobClient.runJob(conf);
        return 0;
    }
    public static void main(String[]
args) throws Exception {
        int exitCode=
ToolRunner.run(new MaxTemperatureDrive(),args);
        System.exit(exitCode);
    }
}

编译文件,编译生成jar文件,通过hadoop的命令行参数,设置本地模式,main函数的参数参入输入输出路径,run函数执行job任务输出结果。

指定用本地模式有两种方法-conf Hadoop-local.xml或者用
–jt local

方法1:指定配置文件、输入路径、输出路径

%mvn compile

%exprot HADOOP_CLASSPATH=target/classes/

%hadoop v2.MaxTempertureDrive –conf conf/hadoop-local.xml
input/ncdc/micro output

方法2指定文件系统、本地模式、输入路径、输出路径。将mapreduce.framework.name的指针设置为local,则使用本地作业运行器运行作业。

%hadoop v2.MaxTempertureDrive –fs file:/// -jt local input/ncdc/micro output

1.1.2        
idea直接调试运行MaxTemperatureDrive

采用hadoop命令运行程序时,没法单步调试。可以直接创建测试类在idea中调试运行。

(1)创建测试类

package Temperature;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileStatus;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.junit.Test;

import static org.junit.Assert.assertThat;

public class MaxTemperatureDriveTest
{
    @Test
    public void test() throws 
Exception
    {
        Configuration conf =new Configuration();
        conf.set("fs.defaultFS","file:///");//设置默认文件系统
        conf.set("mapreduce.framework.name","local");//设置本地运行器模式
        conf.setInt("mapreduce.task.io.sort.mb",1);
        //在工程目录D:\Project\Hadoop\下创建输入input/ncdc/micro和输出目录output
        Path input =new Path("input/ncdc/micro");//输入路径
        Path output=new Path("output");//输出路径
        //删除上一次的输出,避免重复
        FileSystem fs=FileSystem.getLocal(conf);
        fs.delete(output,true);
        MaxTemperatureDrive driver=new MaxTemperatureDrive();
        driver.setConf(conf);//设置driver配置
        //传入输入路径和输出路径,调用run函数运行测试
       int exitcode=
driver.run(new String[] {input.toString(),output.toString()});
       System.out.print(exitcode);
    }
}

(2)项目路径创建输入路径和输出路径,在输入路径中写入测试数据的txt文件

(3)调试运行程序

自己开发了一个股票智能分析软件,功能很强大,需要的点击下面的链接获取:

https://www.cnblogs.com/bclshuai/p/11380657.html

原文地址:https://www.cnblogs.com/bclshuai/p/12042116.html

时间: 2024-08-05 21:58:18

6.4hadoop idea本地运行器测试的相关文章

APP本地服务安全测试

一.安全测试基本分类: 1.系统安全 系统加固 安全加固:比如linux中关闭telnet端口,修改ssh端口 检测一些不必要的服务(需要卸载一个ping)--保证系统的最小集 app安全加固:加一层外壳 补丁 消息中间件:activityMQ,rabbitMQ,safMQ(关闭页面,非业务端口,默认用户) 防火墙规则(iptables) 防病毒 2.应用安全(安装包,服务,业务)----用户(人和服务)口令.敏感信息 (1)黑白名单(IP:port)----访问控制 (2)消息层面:数据加密和

Tiny模板运行器

说到模板开发,当然就离不开要调试,要运行.一般情况下模板语言都是由Java程序驱动跑的,因此,每次都需要搞一个Java类来驱动它,才能运行出结果.有没有更简洁的方式呢?当然是有的,Tiny框架提供了强大的Eclipse插件:模板运行器,用户通过它可以达到快速开发和调试模板语言.         前提条件 在Eclipse环境想要使用Tiny模板运行器,需要满足以下条件: 正确安装Tiny框架提供的Eclipse插件,这是基础要求. 在想要使用模板运行器的工程,pom.xml文件引入依赖org.t

开发函数计算的正确姿势 —— 使用 Fun Local 本地运行与调试

前言首先介绍下在本文出现的几个比较重要的概念: 函数计算(Function Compute): 函数计算是一个事件驱动的服务,通过函数计算,用户无需管理服务器等运行情况,只需编写代码并上传.函数计算准备计算资源,并以弹性伸缩的方式运行用户代码,而用户只需根据实际代码运行所消耗的资源进行付费.函数计算更多信息 参考. Fun: Fun 是一个用于支持 Serverless 应用部署的工具,能帮助您便捷地管理函数计算.API 网关.日志服务等资源.它通过一个资源配置文件(template.yml),

大数据技术之_03_Hadoop学习_02_入门_Hadoop运行模式+【本地运行模式+伪分布式运行模式+完全分布式运行模式(开发重点)】+Hadoop编译源码(面试重点)+常见错误及解决方案

第4章 Hadoop运行模式4.1 本地运行模式4.1.1 官方Grep案例4.1.2 官方WordCount案例4.2 伪分布式运行模式4.2.1 启动HDFS并运行MapReduce程序4.2.2 启动YARN并运行MapReduce程序4.2.3 配置历史服务器4.2.4 配置日志的聚集4.2.5 配置文件说明4.3 完全分布式运行模式(开发重点)4.3.1 虚拟机准备4.3.2 编写集群分发脚本xsync4.3.3 集群配置4.3.4 集群单点启动4.3.5 SSH无密登录配置4.3.6

本地运行项目成功 ,但在服务器运行程序就会报Failed to establish a new connection: [Errno -2] Name or service not known

equests.exceptions.ConnectionError: HTTPSConnectionPool(host='appapi.xxxx.com', port=443): Max retries exceeded with url: /appapi/exchange/19/v1/prolist (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x7fca889818

jnlp本地运行调试

jnpl本地运行调试,需要在java控制面板中设置下,打开控制面板->Java->高级:其中调试下面的启用跟踪启用日志记录,显示小应用程序生命周期异常错误都打上勾.java控制台下面显示控制台选中,就可以在运行的时候看到相关信息了. 记录一下..

本地运行aws lambda credential 配置 (missing credential config error)

参照这篇文章 http://docs.aws.amazon.com/sdk-for-javascript/v2/developer-guide/loading-node-credentials-shared.html You can keep your AWS credentials data in a shared file used by SDKs and the command line interface. The SDK for JavaScript automatically sea

TestNG运行JUnit测试

现在,您已经了解了TestNG和它的各种测试,如果现在担心如何重构现有的JUnit代码,那就没有必要,使用TestNG提供了一种方法,从JUnit和TestNG按照自己的节奏.也可以使用TestNG执行现有JUnit测试用例.TestNG可以自动识别和运行JUnit测试,所以你可以使用TestNG运行所有的测试,并编写新的测试使用TestNG.所有你必须做的就是把JUnit的库TestNG的类路径上,它可以发现并使用JUnit类,改变测试运行从JUnit和TestNG Ant中,然后运行Test

对象初始化器测试

/// <summary>     /// 对象初始化器测试     /// </summary>     public class Initializer     {         //测试对象初始化器         public static void Test1()         {             Student stu1 = new Student() { name = "zhangsan", age = 18 };