Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境

Hadoop研发在java环境的拓展

一 背景

由于一直使用hadoop streaming形式编写mapreduce程序,所以目前的hadoop程序局限于python语言。下面为了拓展java语言研发,本次实验使用window系统,maven打包,centos系统mapr环境运行。

二 步骤

1 查看hadoop版本,命令 Hadoop version,获得版本号hadoop2.7.0

2 编写pow文件,注意hadoop2.7依赖,

<dependency>

<groupId>org.apache.hadoop</groupId>

<artifactId>hadoop-client</artifactId>

<version>2.7.0</version>

</dependency>

3 编写java版的WordCount项目(具体java代码略)

4 maven install 下载依赖包并编译成jar包,在target中把jar包考到集群。

5mapr集群中输入命令运行项目:

hadoop jar maven-hadoop-java-wordcount-template-0.0.1-SNAPSHOT.jar com.example.Driver input output

6实验结果。

运行成功,截图1

截图2

三 附录

eclipse中项目的路径结构

本人将项目源码放在github

https://github.com/rongyux/Hadoop_Maven_Java_HellloWorld

时间: 2024-11-05 21:54:33

Hadoop实战5:MapReduce编程-WordCount统计单词个数-eclipse-java-windows环境的相关文章

Hadoop:MapReduce编程-WordCount统计单词个数-eclipse-java环境

之前习惯用hadoop streaming环境编写python程序,下面总结编辑java的eclipse环境配置总结,及一个WordCount例子运行. 一 下载eclipse安装包及hadoop插件 1去官网下载linux版本的eclipse安装包(或者在本人为了大家方便下载,上传到了csdn下载,网址: 2下载插件:hadoop-eclipse-plugin-2.6.0.jar 二 安装elicpse及hadoop插件 1 把eclipse解压到路径 /user/local/eclipse

Hadoop-MapReduce应用-统计单词个数

先说一些代码中使用到的东西: StringTokenizer:字符串分隔解析类型 *之前没有发现竟然有这么好用的工具类 java.util.StringTokenizer StringTokenizer(String str) : 构造一个用来解析str的StringTokenizer对象. java默认的分隔符是"空格"."制表符('\t')"."换行符('\n')"."回车符('\r')". StringTokenizer

统计单词个数案例

Linux系统将每一个驱动都映射成一个文件.这些文件称为设备文件或驱动文件,都保存在/dev目录中.编写linux驱动最重要的一步就是编写回调函数,否则与设备文件交互的数据无法得到处理. 1. 编写linux驱动程序的步骤: 第 1 步:建立 Linu x 驱动骨架 (装载和卸载 Linu x 驱动): Linux 内核在使用驱动时首先需要装载驱动.当 Linux系统退出时需要卸载 Linux 驱动,在卸载的过程中需要释放由 linux 驱动占用的资源,例如,删除设备文件.释放内存地址空间等.在

第六章、第一个Linux驱动程序:统计单词个数

通过对这一章的学习,我学会了一个完整的Linux驱动:统计单词数的word_count驱动,并学会了如同使用不同的方法来测试Linux驱动,也对Linux的驱动开发过程有了更深刻的了解. 一.编写Linux驱动程序的步骤 1.建立Linux驱动骨架 Module_init处理驱动初始化,module_exit处理驱动退出 2.注册和注销设备文件   Misc_register函数创建和misc_deregister移除设备文件 3.指定与驱动相关的信息 4.指定回调函数 5.编写业务逻辑 6.编

第六章、第一个linux驱动程序:统计单词个数 读书笔记

第六章.第一个linux驱动程序:统计单词个数 一.编写Linux驱动程序的步骤 1.建立Linux驱动骨架(装载和卸载Linux驱动) Module_init处理驱动初始化,module_exit处理驱动退出 2.注册和注销设备文件 Misc_register函数创建和misc_deregister移除设备文件 3.指定与驱动相关的信息 modinfo 4.指定回调函数 5.编写业务逻辑 6.编写makefile文件 7.编译Linux驱动程序 8.安装和卸载Linux驱动 二.Linux驱动

Linux驱动程序:统计单词个数

本例为Android升读探索(卷1):HAL与驱动开发 一书中附带的示例程序.现粘贴出来,以便查阅. 终端操作,可能用到的命令: insmond word_count.ko lsmod | grep word_count 查看驱动是否安装成功 rmmod word_count dmesg | grep word_cout | tail -n 2 查看有linux驱动输出的日志信息 cat /var/log/syslong | grep word_count | tail -n 2 modinfo

第六章主要讲的是第一个linux驱动程序:统计单词个数

从这章开始进入了实战阶段,这一章首先介绍了linux驱动的工作方式,linux将每一个驱动都映射成一个文件,这些文件被称为设备文件或驱动文件,都保存在/dev目录中,使得linux驱动交互就像是普通文件交互一样. 编写linux驱动程序的步骤: 1.建立linux驱动骨架 在linux驱动程序中需要提供两个函数来分别处理驱动初始化和退出的工作.这两个函数分别用module_init和module_exit宏指定. 2.注册和注销设备文件 任何一个linux驱动都需要有一个设备文件,否则应用程序与

第六章 第一个linux个程序:统计单词个数

从本章就开始实战,实例是统计一片文章或者一段文字中的单词个数.还介绍了用不同的方法去测试linux驱动,这些方法主要使用平台来区分. 一.linux:linux跟普通的linux API没什么区别,只是使用方式不同而已.Linux系统每一个驱动都映射成一个文件,这些被映射的文件被称为设备文件或映射文件,并且都保存在./dev目录下. Linux驱动的工作方式:Linux是Unix操作系统的一种变种,在Linux下编写驱动程序的原理和思想完全类似于其他的Unix系统.在Linux环境下设计驱动程序

统计单词个数

驱动开发的第六章让我了解了统计单词个数的Linux驱动程序开发和测试的完整过程. Linux系统将每一个驱动都映射成一个文件,这些文件被称为设备文件或驱动文件,都保存在/dev目录中.由于大多数Linux驱动都有与其对应的设备文件,因此与Linux驱动交换数据就变成了与设备文件交换数据. 编写Linux驱动程序的步骤:第一步,建立Linux驱动骨架(装载和卸载Linux驱动):第二步,注册和注销设备文件:第三步,指定与驱动相关的信息:第四步,指定回调函数:第五步,编写业务逻辑:第六步,编写mak