ubuntu下wordcount例子

在/home/yuanqin/下建立file文件夹,再在文件夹建立file1.txt、file2.txt、file3.txt

file1内容:hello word

file2内容:hello hadoop

file3内容:你好 你是谁 你好 我是袁琴

在hadoop目录下输入: bin/hadoop fs -mkdir input

bin/hadoop fs -put /home/yuanqin/file/file*.txt input

bin/hadoop jar /home/yuanqin/Downloads/hadoop-1.2.1/hadoop-examples-1.2.1.jar wordcount input output

bin/hadoop fs -ls output

bin/hadoop fs -cat output/part-r-00000

时间: 2024-12-30 03:30:57

ubuntu下wordcount例子的相关文章

Ubuntu下使用boost例子

http://blog.csdn.net/dotphoenix/article/details/8459277 1. 安装boost库 sudo apt-get install libboost-all-dev或者使用源代码编译:sudo apt-get install python2.6-dev sudo apt-get install libicu-dev sudo apt-get install libbz2-dev 然后手动下载http://www.bzip.org/1.0.5/bzip

(四)伪分布式下jdk1.6+Hadoop1.2.1+HBase0.94+Eclipse下运行wordCount例子

本篇先介绍HBase在伪分布式环境下的安装方式,然后将MapReduce编程和HBase结合起来使用,完成WordCount这个例子. HBase在伪分布环境下安装 一.   前提条件 已经成功地安装了jdk1.6和hadoop1.2.1. Jdk1.6+Hadoop1.2.1在伪分布环境下具体的安装方法见:Hadoop1.2.1安装——单节点方式和单机伪分布方式 二.   环境 VMware® Workstation 10.04 Ubuntu14.04 32位 Java JDK 1.6.0 h

[编程菜谱]如何在Ubuntu下编译链接最简单的curl例子

简介:有点时间没有在Linux环境下战斗了,刚好需要研究一下curl的API使用,试图编译链接了一个最简单的curl例子,发现了很多问题,最后决定把过程记录下来,以防止未来再犯类似的简单错误,如果能帮助到某位过客,也算是幸事! 食材: Ubuntu 12.04 64-bit 安装了基本的gcc.g++.make,恕不赘述 simple.c 一个最最简单的官网curl的c实例,万丈高楼平地起嘛 步骤: 1. 首先要安装curl的开发环境 sudo apt-get install libcurl4-

Ubuntu下可以直接安装mingw(sudo apt-get install mingw32 mingw32-binutils mingw32-runtime,附例子,简单好用,亲测成功)good

Mingw:在Linux系统下编译Windows的程序 Ubuntu下可以直接安装:sudo apt-get install mingw32 mingw32-binutils mingw32-runtime 安装后编译程序可以:i586-mingw32msvc-g++(编译C++程序)i586-mingw32msvc-gcc(编译C程序) 用法和gcc/g++非常类似.如hello.c程序:#include "windows.h"int WINAPI WinMain (HINSTANC

[Linux][Hadoop] 运行WordCount例子

紧接上篇,完成Hadoop的安装并跑起来之后,是该运行相关例子的时候了,而最简单最直接的例子就是HelloWorld式的WordCount例子.   参照博客进行运行:http://xiejianglei163.blog.163.com/blog/static/1247276201443152533684/   首先创建一个文件夹,并创建两个文件,目录随意,为以下文件结构: examples --file1.txt --file2.txt 文件内容随意填写,我是从新闻copy下来的一段英文: 执

ubuntu下hadoop2.6在eclipse上的配置

1.复制hadoop-eclipse-plugin-2.6.0.jar插件到eclipse的plugins目录下(hadoop2.6的插件,在hadoop自带上没有,要上网下载,多试几个 如果是从ubuntu自带的软件中心安装elcipse的话,则安装目录为:/usr/share/eclipse/dropins/sdk/plugins/不是在/usr/share/eclipse/plugins sudo cp hadoop-eclipse-plugin-2.6.0.jar /usr/share/

Ubuntu下bochs的安装配置

目前市面上流行的全虚拟化PC仿真软件系统主要有三种:VMware公司的VMware Workstation软件.Microsoft公司的Virtual PC以及开放源代码的Bochs.这3种软件都可以虚拟或仿真Intel x86硬件环境,可以让我们在运行这些软件的系统平台上运行多种其它的"客户"操作系统. 就使用范围和运行性能来说,这3种仿真软件有一定的区别.Bochs仿真了x86的硬件环境(CPU的指令)及其外围设备,因此很容易被移植到很多操作系 统上或者不同体系结构的平台上.由于主

在64位Ubuntu下搭建Java web +mysql

今天搭建了一个ubuntu 64位的tomcat + java + mysql的环境,现在总结一下: 1.下载jdk 地址: http://download.oracle.com/otn-pub/java/jdk/7u51-b13/jdk-7u51-linux-x64.tar.gz?AuthParam=1394967394_1531ce17d13be0962e25ec8fe3e45f1d 安装: tar xvf 解压刚下载的jdk压缩包. 然后到/etc/profile(注释:使用vi命令)文件

Ubuntu下编译Android JNI实例全过程

第一步:保证make和gcc可用 在shell中输入make-v,不报错就是对的.(可参考http://wenku.baidu.com/view/d87586c24028915f804dc24a.html.) 在shell中输入gcc-v,不报错就是对的. 第二步:安装NDK 下载NDK后,设置环境变量: 将android-ndk的路劲加到环境变量PATH中:sudogedit /etc/environment 然后再让这个更改的环境变量立即生效:source /etc/environment