Windows平台安装配置Hadoop

      Windows平台安装配置Hadoop

步骤: 
1. JDK安装
2. 下载hadoop2.5.2.tar.gz,自行去百度下载。 
3. 下载hadooponwindows-master.zip【**能支持在windows运行hadoop的工具】https://github.com/steveloughran/winutils


一、 安装hadoop2.5.2

下载hadoop2.5.2.tar.gz ,并解压到你想要的目录下,我放在D:\dev\hadoop-2.5.2 

二、配置hadoop环境变量

1.windows环境变量配置

右键单击我的电脑 –>属性 –>高级环境变量配置 –>高级选项卡 –>环境变量 –> 单击新建HADOOP_HOME,如下图 

2.接着编辑环境变量path,将hadoop的bin目录加入到后面;

三、修改hadoop配置文件

  1. 编辑“D:\dev\hadoop-2.5.2\etc\hadoop”下的core-site.xml文件,将下列文本粘贴进去,并保存;
<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/D:/dev/hadoop-2.5.2/workplace/tmp</value>
    </property>
    <property>
        <name>dfs.name.dir</name>
        <value>/D:/dev/hadoop-2.5.2/workplace/name</value>
    </property>
    <property>
        <name>fs.default.name</name>
        <value>hdfs://localhost:9000</value>
    </property>
</configuration>

2.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的mapred-site.xml(没有就将mapred-site.xml.template重命名为mapred-site.xml)文件,粘贴一下内容并保存;

<configuration>
    <property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
    </property>
    <property>
       <name>mapred.job.tracker</name>
       <value>hdfs://localhost:9001</value>
    </property>
</configuration>

3.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的hdfs-site.xml文件,粘贴以下内容并保存。请自行创建data目录,在这里我是在HADOOP_HOME目录下创建了workplace/data目录;

<configuration>
    <!-- 这个参数设置为1,因为是单机版hadoop -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <name>dfs.data.dir</name>
        <value>/D:/dev/hadoop-2.5.2/workplace/data</value>
    </property>
</configuration>

4.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的yarn-site.xml文件,粘贴以下内容并保存;

<configuration>
    <property>
       <name>yarn.nodemanager.aux-services</name>
       <value>mapreduce_shuffle</value>
    </property>
    <property>
       <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
       <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

5.编辑“D:\dev\hadoop-2.5.2\etc\hadoop”目录下的hadoop-env.cmd文件,将JAVA_HOME用 @rem注释掉,编辑为JAVA_HOME的路径,然后保存;

@rem set JAVA_HOME=%JAVA_HOME%

set JAVA_HOME=D:\java\jdk --jdk安装路径
错误信息:

Error: JAVA_HOME is incorrectly set.
Please update D:\work\hadoop-2.4.1\conf\hadoop-env.cmd
‘-Xmx512m‘ 不是内部或外部命令,也不是可运行的程序
或批处理文件。
原因:java默认安装在C:\Program Files\Java,路径存在空格,所以启动会报错。

解决办法:修改etc/hadoop/hadoop-env.cmd中的JAVA_HOME配置。将C:\Program Files\Java\jdk1.7.0_79修改为C:\Progra~1\Java\jdk1.7.0_79。

Progra~1 = ‘Program Files‘
Progra~2 = ‘Program Files(x86)‘
 

四、替换文件

下载到的hadooponwindows-master.zip,解压,将bin目录(包含以下.dll和.exe文件)文件替换原来hadoop目录下的bin目录;

五、运行环境

1.运行cmd窗口,执行“hdfs namenode -format”; 
2.运行cmd窗口,切换到hadoop的sbin目录,执行“start-all.cmd”,它将会启动以下进程。

成功后,如图: 



至此,hadoop服务已经搭建完毕。

接下来上传测试,操作HDFS

根据你core-site.xml的配置,接下来你就可以通过:hdfs://localhost:9000来对hdfs进行操作了。

1.创建输入目录

C:\WINDOWS\system32>hadoop fs -mkdir hdfs://localhost:9000/user/

C:\WINDOWS\system32>hadoop fs -mkdir hdfs://localhost:9000/user/wcinput

2.上传数据到目录

C:\WINDOWS\system32>hadoop fs -put D:\file1.txt hdfs://localhost:9000/user/wcinput

C:\WINDOWS\system32>hadoop fs -put D:\file2.txt hdfs://localhost:9000/user/wcinput

3.查看文件 

大功告成。


附录:hadoop自带的web控制台GUI

1.资源管理GUI:http://localhost:8088/; 

2.节点管理GUI:http://localhost:50070/; 

原文地址:https://www.cnblogs.com/pinghengxing/p/12071083.html

时间: 2024-10-11 04:53:41

Windows平台安装配置Hadoop的相关文章

Windows平台安装配置mysql数据库

Windows平台安装配置mysql数据库 作者:Eric 微信:loveoracle11g 去下载mysql软件 https://www.mysql.com/downloads/ https://dev.mysql.com/downloads/mysql/ 解压下载的zip文件 d盘新建文件夹mysql ,解压到新建的这个目录 以后这个目录就是mysql的安装目录 配置my.cnf 打开目录,会看到my-default.ini配置文件 复制这个配置文件可以重命名为my.ini或者my.cnf

eclipse下安装配置hadoop(含WordCount程序测试)

这里我为大家介绍如何在windows下安装配置hadoop.,以及测试一个程序 所需要使用的插件和分别有: 一.准备工作 1.eclipse,最好是JAVAEE版本的,以为可以改变模式. 2.hadoop和eclipse的连接器: hadoop-eclipse-plugin-1.2.1.jar(这个是我所使用的,在这里可以自定义选取版本) 3.是hadoop源码包(下载最新的就可以). 将hadoop-0.20.2-eclipse-plugin.jar 复制到eclipse/plugins目录下

Windows平台安装及配置Hadoop(不借助cygwin)

由于项目需要,我在VMware上装了几个虚拟机Windows server 2012 R2,并要搭建Hadoop集群.刚刚入门hadoop,一头雾水,然后开始搜各种教程,首先是选用cygwin进行安装,但是呢,后来出现一堆问题,然后放弃.最终选择直接在Windows server 2012 R2上安装配置Hadoop,在这里非常感谢博友教程,地址是https://blog.csdn.net/antgan/article/details/52067441,基本是按照这个教程来的,主要说下我踩得坑吧

Windows平台安装Redmine2.5.x

安装准备 下载RubyInstaller和Development Kit,也可以使用RailsFTW,轻松搞定windows下的安装. 下载MySql 下载mysql-connector-c-noinstall-6.0.2-win32.zip 下载Redmine 开始安装 1. 安装Ruby 执行RubyInstaller,一路next,安装即可 2. 安装DevKit 执行DevKit-tdm-32-4.5.2-20111229-1559-sfx.exe,解压到:C:\DevKit Win+R

windows平台安装redis服务

有时候我们需要在windows平台上使用redis作为缓存服务,这个时候就需要将redis安装为window服务. 现在将我安装过程记录下来,方便自己或者有类似需求的同学参考.主要是参考网上现有的例子,请轻喷 主要参考如下文章: http://www.it165.net/admin/html/201407/3407.html http://www.cnblogs.com/shanyou/archive/2013/01/17/redis-on-windows.html 如下摘抄的是http://w

Nginx在Windows平台的配置

Nginx在Windows平台的配置 能够使用Nginx搭建Tomcat集群,并完成负载均衡. 1.什么是Nginx 2.为什么使用Nginx 背景: 互联网飞速发展的今天,大用户量高并发已经成为互联网的主体.怎样能让一个网站能够承载几万个或几十万个用户的持续访问呢?这是一些中小网站急需解决的问题.用单机tomcat搭建的网站,在比较理想的状态下能够承受的并发访问量在150到200左右.按照并发访问量占总用户数量的5%到10%这样计算,单点tomcat网站的用户人数在1500到4000左右.对于

PoostgreSQL在Windows平台安装失败的解决

一.问题 最近,测试部门反映在Windows平台安装PostgreSQL 9.4失败,弹出信息框的错误信息大致是: "Problem running post-install step. Installation may not complete correctly.  ..." 其后的信息因不同安装版本而略有不同. 经搜集资料并反复实验,找到了一种可适用于大多数环境(已在win7, win10, win server 2012和 win server 2016验证)的解决办法. 以下

windows平台安装Django

windows平台安装Django 一.前期准备 在安装Django前需要在windows平台安装好python.windows平台的Python已经安装好,版本如下: 二.中期准备 1.下载Django 下载Django的网址为:https://www.djangoproject.com/download,进去选择最新版本下载.此时的最新版本为:Django-1.11.5.tar.gz 2.解压到相应目录 下载好相应的Django版本后,将压缩包复制到Python安装目录,并且解压到Pytho

PHP在Windows下安装配置第一步

第一步就是下载和安装PHP解释器了: 1.下载Windows版本的PHP解释器,下载地址:官方下载 我下载的是 VC11 x64 Thread Safe 这个下面的zip包 2.下载完成后,解压到 C:\php 目录,然后打开目录,解压目录下有个ext子目录,保存了php的一些扩展dll 还有2个文件 ,一个 php.ini-development ,一个是 php.ini-production ,从名字也可以看出是开发环境跟生产环境的区别了 3.复制一份php.ini-development文