运行hadoop自带的wordcount例子程序

1.准备文件
[[email protected] ~]# cat input.txt
hello java
hello python
hello c
hello java
hello js
hello html
hello java
[[email protected] ~]# hadoop fs -mkdir /input
[[email protected] ~]# hadoop fs -put input.txt /input
[[email protected] ~]# hadoop fs -ls /input
Found 1 items
-rw-r--r-- 2 root supergroup 74 2018-11-14 21:42 /input/input.txt

2.例子程序位置
/usr/local/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar

3.运行
[[email protected] ~]# hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/input.txt /output
[[email protected] ~]# hadoop fs -ls /output/
Found 2 items
-rw-r--r-- 2 root supergroup 0 2018-11-14 21:46 /output/_SUCCESS
-rw-r--r-- 2 root supergroup 40 2018-11-14 21:46 /output/part-r-00000

4.查看结果
[[email protected] ~]# hadoop fs -text /output/part-r-00000
c 1
hello 7
html 1
java 3
js 1
python 1

原文地址：https://www.cnblogs.com/413xiaol/p/9961028.html

时间： 2024-09-29 10:02:08

运行hadoop自带的wordcount例子程序的相关文章

运行Hadoop自带的wordcount单词统计程序

0.前言前面一篇<Hadoop初体验:快速搭建Hadoop伪分布式环境>搭建了一个Hadoop的环境,现在就使用Hadoop自带的wordcount程序来做单词统计的案例. 1.使用示例程序实现单词统计 (1)wordcount程序 wordcount程序在hadoop的share目录下,如下: [[email protected] mapreduce]# pwd /usr/local/hadoop/share/hadoop/mapreduce [[email protected] mapr

运行hadoop自带的计算圆周率异常

运行hadoop2 自带的圆周率计算方法时,报错,找了半天,原来是在配置hadoop临时目录时,没有给权限,找到配置的hadoop临时目录文件夹,修改权限即可 Application application_1548242073562_0005 failed 2 times due to AM Container for appattempt_1548242073562_0005_000002 exited with exitCode: 1 Failing this attempt.Diagno

如何运行Hadoop自带的例子

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.4.jar wordcount /WordCount/WordCount /WCOutput 输出文件不能实现存在,比如说/WordCount这样是不行的虽然他是第一级文件夹但是已存在了,不可用原来提示我,日志冲突,我美观,我以为是不是hadoop native造成的,后来吧多余的mahout的jar删了,里面也有slf4j,然后竟然运行成功了额,虽然也不

运行 Hadoop 的 MapReduce 示例卡住了【已解决】

1. 说明在以伪分布式模式运行 Hadoop 自带的 MapReduce 示例,卡在了 Running job ,如图所示 2. 解决过程查看日志没得到有用的信息再次确认配置信息没有错误信息最终修改了 hosts 添加本机的 hosts ,如下 192.168.23.101 s101 重新将 SSH 进行配置,最终修改了 SSH 远程登陆配置笔记. 再次运行示例,程序顺利运行. 原文地址:https://www.cnblogs.com/share23/p/9696070.html

利用hadoop自带程序运行wordcount

1.启动hadoop守护进程 bin/hadoop start-all.sh 2.在hadoop的bin目录下建立一个input文件夹 mkdire input 3.进入input目录之后,在input目录下新建两个文本文件,并想其写入内容 echo "hello excuse me fuck thank you">test1.txt echo "hello how do you do thank you">test2.txt 4.进入hadoop的bi

[hadoop]命令行编译并运行hadoop例子WordCount

首先保证JDK.Hadoop安装设置成功可以参考[linux]ubuntu下安装hadoop [linux]ubutnu12.04 下安装jdk1.7 使用hadoop版本为1.2.1,jdk为1.7 在hadoop-1.2.1\src\examples\org\apache\hadoop\examples找到WordCount.java 源码如下: 1 /** 2 * Licensed under the Apache License, Version 2.0 (the "License&q

hadoop集群自带WordCount例子

默认当前位置是hadoop安装包位置 jar包:share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.0.jar 一前置准备 $ cd share/hadoop/mapreduce/ 因为这个需要hdfs中的文件,需要掌握基本的hdfs命令 HDFS基本的文件命令: 格式: hadoop fs -cmd <args> 其中,cmd代表具体的文件命令,与unix对应的命令相同,args表示可变的参数. 如, hadoop fs --获取完整的

（二）Hadoop例子——运行example中的wordCount例子

Hadoop例子——运行example中的wordCount例子一. 需求说明单词计数是最简单也是最能体现MapReduce思想的程序之一,可以称为 MapReduce版"Hello World",该程序的完整代码可以在Hadoop安装包的"src/examples"目录下找到.单词计数主要完成功能是:统计一系列文本文件中每个单词出现的次数,如下图所示. 二. 环境 VMware® Workstation 10.04 Ubuntu14.04 32位 J

[Linux][Hadoop] 运行WordCount例子

紧接上篇,完成Hadoop的安装并跑起来之后,是该运行相关例子的时候了,而最简单最直接的例子就是HelloWorld式的WordCount例子. 参照博客进行运行:http://xiejianglei163.blog.163.com/blog/static/1247276201443152533684/ 首先创建一个文件夹,并创建两个文件,目录随意,为以下文件结构: examples --file1.txt --file2.txt 文件内容随意填写,我是从新闻copy下来的一段英文: 执

猜你喜欢

（转载）SQL基础--> 约束(CONSTRAINT)

感谢Leshami的分享,原文地址:http://blog.csdn.net/leshami/article/details/5711367 --=========================== ...

原子操作&优化和内存屏障

原子操作假定运行在两个CPU上的两个内核控制路径试图执行非原子操作同时"读-修改-写"同一存储器单元.首先,两个CPU都试图读同一单元,但是存储器仲裁器插手,只允许其中的一个访问 ...

12-27cell 的可重用性（英雄列表应用性能的优化）

在英雄列表中动态生成cell的代码在中, - (UITableViewCell*)tableView:(UITableView *)tableView cellForRowAtIndexPath:(N ...

three.js 简介

What is Three.js? Let's try to describe it briefly: Three.js is a library that makes WebGL - 3D in t ...

Android基础整合项目之节日群发助手(二)

Android基础整合项目(一) 之节日群发助手part 2 --转载请注明出处:coder-pig 本节引言: 在上一节中我们已经做出了我们群发助手的第一个界面以及完成了联系人的读取以及数据库的录 ...

51nod算法马拉松14

这次太丢人了只搞出来了A到D,那就将就写一写A到D... A 棋盘问题脑筋急转弯题,不难发现每一次两个人只能染白奇数个格子,所以数数有奇数还是偶数个白格子就行了. #include<cstdi ...

相对定位 and 绝对定位 and 固定定位

CSS盒子定位有三种相对定位 position: relative; 绝对定位 position: absolute; 固定定位 position: fixed; 相对定位 position ...

仗守匦埔叵zca054dtgtdknc

他这移动不要紧,王冬顿时身体一震,"啊"的惊呼一声,"雨浩,你醒了."其本人也一直未返回内地,对于佳兆业来说,全面恢复正常运营仍需一些时间.一个赤金色的光球出现 ...

软件工程学习、问题

对于学习软件工程这门课程,我认为有许多东西要学习.其实在我看来学习这门课程的精髓是学习一种方法.是一个如何去分析和处理问题的过程,应该说其范畴已经远远不止局限于该门课程,成为了一个综合的一个能够解决问 ...

NAT

NAT术语 Inside network:需要翻译成外部地址的内部网络.--------> Outside network:使用合法地址进行通信的外部网络. Local address:内部网络 ...

LRU Cache的实现

代码如下: 来自为知笔记(Wiz)

@Autowired @Resource @Qualifier的区别

参考博文: http://www.cnblogs.com/happyyang/articles/3553687.html http://blog.csdn.net/revent/article/det ...

Struts类型转换

第一步从JSP页面表单传递到控制层处理的属性, 定义属性来进行接收 JSP页面表单: 控制层: [这是实现类型转化的前奏] 还不够,还需要1个自定义转换类,是Struts提供的:和1个propert ...

1412091645-hd-ZOJ

ZOJ Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Submis ...

存储过程调试

SQL SERVER2008存储过程调试昨天被问到sql server中存储过程怎么调试,我曾经写存储过程,调试方法非常笨拙,就是逐条运行语句,然后查看结果是不是预期的,这样的调试方法,实在是无奈之 ...

asp.net读取CSV

用Excel导了两天数据,各种问题,折磨客户也折磨了自己,以前没发现的问题一下子都暴露出来了特意收集两篇Excel跟CSV读取相关的两篇文章 asp.net读取excel文件,将excel文件先上传 ...

关于css的text-indent首行缩进两个字符和图片缩进的问题

段落前面空两个字的距离,不要再使用空格了.应该使用首行缩进text-indent. text-indent可以使得容器内首行缩进一定单位.比如中文段落一般每段前空两个汉字. <style typ ...

技术领域的半边天

男人做技术,一般考虑的是爱好和做技术的出路问题.而很多时候女性从事技术大多会有人说适不适合的问题,比如技术员整日加班,有些岗位需要经常出差,高强度的劳动,不规律的生活,对脑细胞和身体都是一项非常大的挑 ...

可恨的是客户和项目经理，白天不懂夜的黑

为什么程序员/设计师怕改需求?网上有类似的段子,比如:「杀一个程序员不需要用枪,改三次需求就可以了.」最近有网友在知乎上提问「如何向外行解释产品经理频繁更改需求为什么会令程序员烦恼?」.本文综合了 ...

11.2-全栈Java笔记:Java中如何实现多线程

在JAVA中使用多线程非常简单,我们先学习如何创建和使用线程,然后结合案例再深入剖析线程的特性. 通过继承Thread类实现多线程继承Thread类实现多线程的步骤: 1. 在Java中负责线程的这 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.028 s.