Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境

Hadoop研发在java环境的拓展

一背景

由于一直使用hadoop streaming形式编写mapreduce程序，所以目前的hadoop程序局限于python语言。下面为了拓展java语言研发，本次实验使用window系统，maven打包，centos系统mapr环境运行。

二步骤

1 查看hadoop版本，命令 Hadoop version，获得版本号hadoop2.7.0

2 编写pow文件，注意hadoop2.7依赖，

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-client</artifactId>

</dependency>

3 编写java版的WordCount项目（具体java代码略）

4 maven install 下载依赖包并编译成jar包，在target中把jar包考到集群。

5mapr集群中输入命令运行项目：

hadoop jar maven-hadoop-java-wordcount-template-0.0.1-SNAPSHOT.jar com.example.Driver input output

6实验结果。

运行成功，截图1

截图2

三附录

eclipse中项目的路径结构

本人将项目源码放在github

https://github.com/rongyux/Hadoop_Maven_Java_HellloWorld

时间： 2024-11-05 21:54:33

Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境的相关文章

Hadoop:MapReduce编程-WordCount统计单词个数-eclipse-java环境

之前习惯用hadoop streaming环境编写python程序,下面总结编辑java的eclipse环境配置总结,及一个WordCount例子运行. 一下载eclipse安装包及hadoop插件 1去官网下载linux版本的eclipse安装包(或者在本人为了大家方便下载,上传到了csdn下载,网址: 2下载插件:hadoop-eclipse-plugin-2.6.0.jar 二安装elicpse及hadoop插件 1 把eclipse解压到路径 /user/local/eclipse

Hadoop-MapReduce应用-统计单词个数

先说一些代码中使用到的东西: StringTokenizer:字符串分隔解析类型 *之前没有发现竟然有这么好用的工具类 java.util.StringTokenizer StringTokenizer(String str) : 构造一个用来解析str的StringTokenizer对象. java默认的分隔符是"空格"."制表符('\t')"."换行符('\n')"."回车符('\r')". StringTokenizer

统计单词个数案例

Linux系统将每一个驱动都映射成一个文件．这些文件称为设备文件或驱动文件,都保存在/dev目录中.编写linux驱动最重要的一步就是编写回调函数,否则与设备文件交互的数据无法得到处理. 1. 编写linux驱动程序的步骤: 第 1 步:建立 Linu x 驱动骨架 (装载和卸载 Linu x 驱动): Linux 内核在使用驱动时首先需要装载驱动.当 Linux系统退出时需要卸载 Linux 驱动,在卸载的过程中需要释放由 linux 驱动占用的资源,例如,删除设备文件.释放内存地址空间等.在

第六章、第一个Linux驱动程序：统计单词个数

通过对这一章的学习,我学会了一个完整的Linux驱动:统计单词数的word_count驱动,并学会了如同使用不同的方法来测试Linux驱动,也对Linux的驱动开发过程有了更深刻的了解. 一.编写Linux驱动程序的步骤 1.建立Linux驱动骨架 Module_init处理驱动初始化,module_exit处理驱动退出 2.注册和注销设备文件 Misc_register函数创建和misc_deregister移除设备文件 3.指定与驱动相关的信息 4.指定回调函数 5.编写业务逻辑 6.编

第六章、第一个linux驱动程序：统计单词个数读书笔记

第六章.第一个linux驱动程序:统计单词个数一.编写Linux驱动程序的步骤 1.建立Linux驱动骨架(装载和卸载Linux驱动) Module_init处理驱动初始化,module_exit处理驱动退出 2.注册和注销设备文件 Misc_register函数创建和misc_deregister移除设备文件 3.指定与驱动相关的信息 modinfo 4.指定回调函数 5.编写业务逻辑 6.编写makefile文件 7.编译Linux驱动程序 8.安装和卸载Linux驱动二．Linux驱动

Linux驱动程序：统计单词个数

第六章主要讲的是第一个linux驱动程序：统计单词个数

从这章开始进入了实战阶段,这一章首先介绍了linux驱动的工作方式,linux将每一个驱动都映射成一个文件,这些文件被称为设备文件或驱动文件,都保存在/dev目录中,使得linux驱动交互就像是普通文件交互一样. 编写linux驱动程序的步骤: 1.建立linux驱动骨架在linux驱动程序中需要提供两个函数来分别处理驱动初始化和退出的工作.这两个函数分别用module_init和module_exit宏指定. 2.注册和注销设备文件任何一个linux驱动都需要有一个设备文件,否则应用程序与

第六章第一个linux个程序：统计单词个数

从本章就开始实战,实例是统计一片文章或者一段文字中的单词个数.还介绍了用不同的方法去测试linux驱动,这些方法主要使用平台来区分. 一.linux:linux跟普通的linux API没什么区别,只是使用方式不同而已.Linux系统每一个驱动都映射成一个文件,这些被映射的文件被称为设备文件或映射文件,并且都保存在./dev目录下. Linux驱动的工作方式:Linux是Unix操作系统的一种变种,在Linux下编写驱动程序的原理和思想完全类似于其他的Unix系统.在Linux环境下设计驱动程序

统计单词个数

驱动开发的第六章让我了解了统计单词个数的Linux驱动程序开发和测试的完整过程. Linux系统将每一个驱动都映射成一个文件,这些文件被称为设备文件或驱动文件,都保存在/dev目录中.由于大多数Linux驱动都有与其对应的设备文件,因此与Linux驱动交换数据就变成了与设备文件交换数据. 编写Linux驱动程序的步骤:第一步,建立Linux驱动骨架(装载和卸载Linux驱动):第二步,注册和注销设备文件:第三步,指定与驱动相关的信息:第四步,指定回调函数:第五步,编写业务逻辑:第六步,编写mak

Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境

Hadoop研发在java环境的拓展

一 背景

二 步骤

三 附录

Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境的相关文章

一背景

二步骤

三附录