windows下搭建hadoop-2.6.0本地idea开发环境

概述

本文记录windows下hadoop本地开发环境的搭建:

OS:windows
hadoop运行模式:独立模式

安装包结构:

Hadoop-2.6.0-Windows.zip
    - cygwinInstall // cygwin离线安装包
    - hadoop-2.6.0-windows.tar.gz // hadoop-2.6.0 windows安装包

PS:

hadoop-2.6.0-windows.tar.gz是基于官方发行包hadoop-2.6.0.tar.gz,并为windows单机测试而自定义的包,改动如下:
1. 在bin目录下,添加了hadoop.dll和winutils.exe
2. 修改了org\apache\hadoop\io\nativeio\NativeIO.java源码第558行

*由于源码有改动,此包不能用于生产环境,只限于windows环境下的开发测试

1. 安装cygwin

  1. 双击cygwinInstall下的setup-x86_64.exe
  2. 选择从本地安装

  3. 选择安装位置

  4. 选择本地安装文件位置

  5. 点击All旁边的default,使其变为Install,再点击下一步即可开始安装

2. 安装hadoop

  1. 在cygwin的根目录下,建立opt目录,并把安装包拷贝到opt目录下

    cd /; mkdir opt

  2. 解压

    cd /opt; tar xzf hadoop-2.6.0-windows.tar.gz

  3. 设置环境变量

    设置windows环境变量HADOOP_PREFIX指向hadoop安装目录

    设置windows环境变量HADOOP_HOME指向hadoop安装目录

    设置windows环境变量JAVA_HOME指向java安装目录

    Path环境变量后追加:;%HADOOP_HOME%\bin

  4. ~/.bashrc中设置以下环境变量:

    export HADOOP_CLASSPATH=$(cygpath -pw $(hadoop classpath)):$HADOOP_CLASSPATH

  5. 使~/.bashrc生效,并验证hadoop是否工作

    source ~/.bashrc

    验证hadoop:

    hadoop version

    若正常显示版本信息则安装成功

  6. 运行示例代码,验证hadoop是否能够运行mapreduce

    cd /opt/hadoop-2.6.0; mkdir input; cd input; echo "Hello World" > test

    hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar wordcount input output

    若正常执行则显示:

    在/opt/hadoop-2.6.0/output下会生成part-r-00000文件,包含以下内容:

    Hello   1
    world   1
    

3. idea开发环境配置

  1. 创建一个mapreduce项目

  2. 选择项目,按下F12,添加外部依赖

  3. 添加HADOOP_HOME下必要的jar包

  4. 进入运行配置

  5. 配置运行参数

    Working directory设置为hadoop安装目录

    并设置输入参数

  6. 调试

    和普通java程序一样打断点进行调试

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-08 09:46:23

windows下搭建hadoop-2.6.0本地idea开发环境的相关文章

在Windows下搭建SVN服务器并且集成到 Eclipse 开发环境中

一.准备工作 1.获取 Subversion 服务器  http://mirrors.hust.edu.cn/apache/subversion/ 到官方网站下载最新的服务器安装程序.地址:http://mirrors.hust.edu.cn/apache/subversion/ 2.获取 TortoiseSVN 客户端 从官方网站  获取最新的 TortoiseSVN .地址:http://tortoisesvn.net/downloads TortoiseSVN 是一个客户端程序,用来与 s

Windows8.1+Eclipse搭建Hadoop2.7.2本地模式开发环境

下面介绍如何在Windows8.1上搭建hadoop2.7.2的本地模式开发环境,为后期做mapreduce的开发做准备. 在搭建开发环境之前,首先选择开发工具,就是大家都很熟悉的Eclipse(本人这次使用的是eclipse4.4.2版本),Eclipse提供了hadoop的插件,我们通过这个插件,就可以在eclipse中编写mapreduce.但是,这个插件可能会随着hadoop的版本升级或者eclipse的版本升级,而需要相应的去进行编译.所以,在我们开发之前,学会编译这个eclipse的

本地windows下搭建git的本地服务器

本地windows下搭建git的本地服务器 准备工作: 本地安装java环境,配置环境变量(略) 下载gitblit文件,百度一大堆 开始第一步: 减压gitblit压缩包到某个目录下,比如我在:H:\gitblit 第二步: 修改gitblit安装目录下的data文件下的gitblit.properties 第17行处:include = defaults.properties 修改为 include = my.properties 第三步: 从data文件夹下找到defaults.prope

Windows下搭建本地SVN服务器

本文介绍Windows下搭建本地SVN服务器的方法,网上资料比较少也比较旧,大都介绍的是旧版本SVN使用svnserve.exe安装svn服务的方法,而下面将会详细介绍使用sc命令建立服务器并开启服务,这是搭建本地SVN服务器的关键所在! SVN 全名是 Subversion,它是一个开源的版本控制软件,官网链接:http://tortoisesvn.net/ ,与它类似的软件有CVS,VSS,ClearCase.而 SVN 作为一个跨平台的开源软件,具有很强的活力,目前也已经相当成熟,很多开源

Windows上搭建hadoop开发环境

前言 Windows下运行Hadoop,通常有两种方式:一种是用VM方式安装一个Linux操作系统,这样基本可以实现全Linux环境的Hadoop运行:另一种是通过Cygwin模拟Linux环境.后者的好处是使用比较方便,安装过程也简单,本篇文章是介绍第二种方式Cygwin模拟Linux环境. 准备工作 (1)安装JDK1.6或更高版本,安装时注意,最好不要安装到带有空格的路径名下,例如:Programe Files,否则在配置Hadoop的配置文件时会找不到JDK. (2)hadoop官网下载

在windows下安装hadoop

本博文完全引用于http://blog.csdn.net/nazarite_wen/article/details/34409923.防止引用博文被删除,重新copy一遍. Windows下运行Hadoop,通常有两种方式:一种是用VM方式安装一个Linux操作系统,这样基本可以实现全Linux环境的Hadoop运行:另一种是通过Cygwin模拟Linux环境.后者的好处是使用比较方便,安装过程也简单.在这里咱们就来看看第二种方案:如何再Windows下快速安装一个Hadoop环境,并结合Ecl

Windows下运行Hadoop

Windows下运行Hadoop,通常有两种方式:一种是用VM方式安装一个Linux操作系统,这样基本可以实现全Linux环境的Hadoop运行:另一种是通过Cygwin模拟Linux环境.后者的好处是使用比较方便,安装过程也简单.在这里咱们就来看看第二种方案:如何再Windows下快速安装一个Hadoop环境,并结合Eclipse开发环境研究和调整Hadoop代码. 整个安装过程包括以下三大步骤: 安装和配置Cygwin(http://cygwin.com/install.html) 安装和配

虚拟机安装的三台Ubuntu系统下搭建Hadoop

在Linux 上安装Hadoop 教程 在虚拟机中安装的Ubuntu系统下搭建Hadoop集群时首先要解决的问题是将宿主机的文件拷贝到虚拟机上.采用的简单方法是宿主机使用Serv-U建立一个FTP然后在虚拟机上登录将文件拷出来. 要先熟悉Linux的基本概念和操作,如:cd.ls.tar.cat.ssh.scp.cp.rm.sudo.su.apt-get等操作. 一.实践环境: Ubuntu10.04+jdk1.6+hadoop-0.20.1 机器名 IP 作用 Master 192.168.1

windows下搭建nginx-rtmp服务器

windows下搭建nginx-rtmp服务器 windows下搭建nginx-rtmp服务器 准备工作 安装MinGW 安装Mercurial 安装strawberryperl 安装nasm 下载nginx相关的源码包 编译nginx nginx-rtmp环境搭建 效果测试 最后说明 最近因为接触直播相关的技术工作,使用的也是基于高并发和高性能的nginx,首先需要做的当然是搭建一个nginx服务器. 对于linux上nginx服务器的搭建此处就不再赘述,按照操作指引来的话一般都能顺理成章搭建