在 Windows 上安装 Hadoop 教程(转)

在 Windows 上安装 Hadoop 教程

一见 2010.1.6 www.hadoopor.com/[email protected]

1. 安装 JDK

不建议只安装 JRE,而是建议直接安装 JDK,因为安装 JDK 时,可以同时安装 JRE。 MapReduce 程序的编写和 Hadoop 的编译都依赖于 JDK,光 JRE 是不够的。

JRE 下载地址:http://www.java.com/zh_CN/download/manual.jsp

JDK 下载地址:http://java.sun.com/javase/downloads/index.jsp,下载 Java SE 即可。

2. 安装 Cygwin

在安装 Cygwin 之前,得先下载 Cygwin 安装程序 setup.exe。

Cygwin 安 装 程 序 下 载 地 址 : http://www.cygwin.com/setup.exe, 当 然 也 可 以 从 http://www.cygwin.cn/setup.exe下载 Cygwin 安装程序,不过如果在安装过程中,遇到如下图所示的错误,则只能从 http://www.cygwin.com/setup.exe下载,本教程下载的是 Cygwin 1.7.1 版本。

Cygwin 安装程序 setup.exe 的存放目录可随意无要求。当 setup.exe 下载成功后,运行

setup.exe,弹出如下图所示的对话框:

在上图所示的对话框中,直接点击“下一步”,进入如下图所示的对话框:

在上图所示的对话框中,选择“Install from Internet”,然后点击“下一步”,进入如下图 所示对话框:

在上图所示的对话框中,设置 Cygwin 的安装目录,Install For 选 择“All Users”,Default Text File Type 选择“Unix/binary”,然后点击“下一步”,进入如下图所示对话框:

在上图所示的对话框中,设置 Cygwin 安装包存放目录,然后点击“下一步”,进入如 下图所示对话框:

在上图所示的对话框中,选择“Direct Connection”,然后点击“下一步”,进入如下图 所示对话框:

在上图所示的对话框中,点击“下一步”,将进入如下图所示的对话框:

在上图所示的对话框过程中,可能会弹出如下图所示的“Setup Alert”对话框,直接点 击“确定”即可。

进入“Select Packages”对话框后,必须保证“Net Category”下的“OpenSSL”被安装 , 如下图所示:

如果还打算在 eclipse 上编译 Hadoop,则还必须安装“Base Category”下的“sed”,如 下图所示:

另外,还建议将“Editors Category”下的 vim 安装,以方便在 Cygwin 上直接修改配置 文 件 ;“Devel Category”下的 subversion 建议安装,如下图所示:

当完成上述操作后,点击“Select Packages”对话框中“下一步”,进入 Cygwin 安装包 下载过程,如下图所示:

等待安装包下载完毕,当下载完后,会自动进入到如下图所示的对话框:

在上图所示的对话框中,选中“Create icon on Desktop”,以方便直接从桌面上启动 Cygwin,然后点击“完成”按钮。至此,Cgywin 已经安装完,安装目录下的内容如下图所 示:

3. 配置环境变量

需要配置的环境变量包括 PATH 和 JAVA_HOME:JAVA_HOME 指向 JRE 安 装 目 录 ;JDK 的 bin 目录,Cygwin 的 bin 目录,以及 Cygwin 的 usr\bin 目录都必须添加到 PATH 环境变量 中,如下图所示:

4. 安装 sshd 服务

点击桌面上的 Cygwin 图标,启动 Cygwin,执行 ssh-host-config命令,如下图所示:

在执行 ssh-host-config 时,当要求输入 yes/no 时,选择输入 no,如下图所示:

如果是 Cygwin 1.7 之前的版本,则 ssh-host-config 显示界面如下图所示:

当看到“Have fun”时,一般表示 sshd 服务安装成功了,如上图所示。接下来,需要启 动 sshd 服务。

5. 启动 sshd 服务

在桌面上的“我的电脑”图标上单击右键,点击“管理”菜单,进入 Windows 计算机 管理,如下图所示:

在上图所示的对话框中,选中“CYGWINsshd”,弹出右键,并启动 CYGWIN sshd 服 务,成功后,如下图所示:

当 CYGWIN sshd 的状态为“已启动”后,接下来就是配置 ssh 登录。

6. 配置 ssh 登录

执行 ssh-keygen命令生成密钥文件,如下图所示:

在上图所示对话框中,需要输入时,直接按回车键即可,如果不出错,应当是需要三次 按回车键。接下来生成 authorized_keys文件,按下图所示操作即可:

正如上图所示,只需要两步操作,即可生成 authorized_keys文件:

cd ~/..ssh/

cp id_rsa.pub authorized_keys

完成上述操作后,执行 exit命令先退出 Cygwin 窗口,如果不执行这一步操作,下面的 操作可能会遇到错误。接下来,重新运行 Cygwin,执行 ssh localhost 命令,在第一次执行 ssh localhost 时,会有如下图所示的提示,输入 yes,然后回车即可:

如果是 Windows 域用户,这步操作可能会遇到问题,错误信息如下:。

这 个 错 误 暂 无 解 决 办 法 , 问 题 的 解 决 情 况 , 可 关 注 Hadoop 技 术 论 坛 中 的 贴 : http://bbs.hadoopor.com/thread-348-1-1.html(Cygwin1.7.1 版本ssh问题)。否则,如果成功, 执行 who 命令时,可以看到如下图所示的信息:

至此,配置 ssh 登录成功,下面就可以开始安装 hadoop 了。

7. 下载 hadoop 安装包

hadoop 安装包下载地址:

http://labs.xiaonei.com/apache-mirror/hadoop/core/hadoop-0.20.1/hadoop-0.20.1.tar.gz

8. 安装 hadoop

将 hadoop 安装包 hadoop-0.20.1.tar.gz 解压到 D:\hadoop\run 目 录( 以修改成其它目录) 下,如下图所示:

接下来,需要修改 hadoop 的配置文件,它们位于 conf 子目录下,分别是 hadoop-env.sh、 core-site.xml、hdfs-site.xml 和 mapred-site.xml 共四个文件。在 Cygwin 环 境 ,masters 和 slaves 两个文件不需要修改。

? 修改 hadoop-env.sh

只需要将 JAVA_HOME 修改成 JDK 的安装目录即可,请注意 JDK 必须是 1.6 或 以上 版本 。

? 修改 core-site.xml

为简化 core-site.xml 配置,将 D:\hadoop\run\src\core 目录下的 core-default.xml 文件复制 到 D:\hadoop\run\conf 目 录 下 , 并 将 core-default.xml 文 件 名 改 成 core-site.xml 。 修 改 fs.default.name 的值,如下所示:

上图中的端口号 8888,可以改成其它未被占用的端口。

? 修改 hdfs-site.xml

为简化 hdfs-site.xml 配置,将 D:\hadoop\run\src\hdfs 目录下的 hdfs-default.xml 文件复制 到 D:\hadoop\run\conf 目录下,并将 hdfs-default.xml 文件名改成 hdfs-site.xml。不需要再做其 它修改。

? 修改 mapred-site.xml

为简化 mapred-site.xml 配置,将 D:\hadoop\run\src\mapred 目录下的 mapred-default.xml

文件复制到 D:\hadoop\run\conf 目录下,并将 mapred-default.xml 文件名改成 mapred-site.xml。

上图中的端口号 9999,可以改成其它未被占用的端口。到这里,hadoop 宣告安装完毕, 可以开始体验 hadoop 了!

9. 启动 hadoop

在 Cygwin 中,进入 hadoop 的 bin 目录,运行./start-all.sh 启动 hadoop,在启动成功之后 , 可以执行./hadoop fs -ls /命令,查看 hadoop 的根目录,如下图所示:

如果运行 mapreduce,请参考其它文档,本教程的内容到此结束。

时间: 2024-08-03 03:06:41

在 Windows 上安装 Hadoop 教程(转)的相关文章

在Linux上安装Hadoop

先决条件: Hadoop是用JAVA写的,所以首先要安装Java.在Ubuntu上安装JDK见:http://blog.csdn.net/microfhu/article/details/7667393 我下载的Hadoop版本号是2.4.1.要求至少安装JDK 6以上. Linux是唯一支持的生产环境.Unix.Windows或者Mac OS能够作为开发环境.在Windows上安装Hadoop须要Cygwin.而且在Cygwin里要包括openssh. 到hadoop.apache.org上下

hadoop入门-在windows上安装,测试hadoop

上一篇简单叙述了怎么样在windows上编译hadoop,接着上一篇,这篇叙述怎么样安装hadoop并进行简单的验证安装是否正确.编译的机器与安装的机器分开. 我编译的机器是windows7,安装的机器是windows 2008 r2. 第一步:编译完之后,会在target目录下生成hadoop-2.2.0.tar.gz文件,将该文件解压到一个目录下面,然后将整个目录拷贝到目标机器上,尽量选择简单的目录,比如e:\hd 第二步:添加HADOOP_HOME到系统环境变量里,值为e:\hd.并将%H

windows上安装Anaconda和python的教程详解

一提到数字图像处理编程,可能大多数人就会想到matlab,但matlab也有自身的缺点: 1.不开源,价格贵 2.软件容量大.一般3G以上,高版本甚至达5G以上. 3.只能做研究,不易转化成软件. 因此,我们这里使用Python这个脚本语言来进行数字图像处理. 要使用Python,必须先安装python,一般是2.7版本以上,不管是在windows系统,还是Linux系统,安装都是非常简单的. 要使用python进行各种开发和科学计算,还需要安装对应的包.这和matlab非常相似,只是matla

星辉信息Odoo安装教程-在 Windows 上安装 Odoo

一键安装包可以在 Odoo 官网上下载,包含各个版本及主分支,这里有 Windows 安装包(.exe).Debian 安装包(.deb)和 CentOS 安装包(.rpm).要在 Windows 上安装,仅需在对应版本的 nightly 文件夹中找到.exe 并进行安装.安装包非常方便,它包含安装 Odoo 所需的所有部分:Python 3.PostgreSQL 数据库.Odoo 服务端以及其它 Odoo 依赖.安装时会创建一个 Windows 服务在开机时自动启动 Odoo 和 Postgr

Odoo安装教程-在 Windows 上安装 Odoo

一键安装包可以在 Odoo 官网上下载,包含各个版本及主分支,这里有 Windows 安装包(.exe).Debian 安装包(.deb)和 CentOS 安装包(.rpm).要在 Windows 上安装,仅需在对应版本的 nightly 文件夹中找到.exe 并进行安装.安装包非常方便,它包含安装 Odoo 所需的所有部分:Python 3.PostgreSQL 数据库.Odoo 服务端以及其它 Odoo 依赖.安装时会创建一个 Windows 服务在开机时自动启动 Odoo 和 Postgr

在Windows上安装虚拟机详细图文教程

用虚拟机来安装最新的软件,安装最新的系统等等比较保险,可以避免安装不顺利影响自己原来的系统和应用,想尝鲜又担心自己完全更换系统不适应的朋友可以尝试. 虚拟机下载:https://yunpan.cn/cqdKMyu9AWjsw  访问密码 7be7 在Windows上安装虚拟机. 选择自己的路径: 在桌面创建一个图标: 启动虚拟机,新建虚拟机,并进行各种硬件定制.

64位Windows下安装Redis教程

这篇文章主要介绍了64位Windows下安装Redis教程,本文使用Microsoft Open Tech group 在 GitHub上开发的一个Win64版本的Redis,需要的朋友可以参考下 Redis对于Linux是官方支持的,安装和使用没有什么好说的,普通使用按照官方指导,5分钟以内就能搞定.详情请参考:http://redis.io/download 但有时候又想在windows下折腾下Redis,可以从redis下载页面看到如下提示: 复制代码 代码如下: Win64 Unoffi

在Windows上安装PyCUDA和Theano

最近几个月在学习Deep Learning,刚开始的时候什么条件都不具备.自己从淘宝上面买了一个GT 240,搭建一个GPU环境用于程序的调试.折腾了几个月,以前PyCUDA总是搭建失败,最近几天才尝试成功.为了学习Deep Learning的源代码,自己又搭建了Theano环境.由于时间紧张,自己概略总结如下,以备忘记. 一. 在Windows上安装PyCUDA 1. 安装条件 (1) pytools库 安装PyCUDA还需要pytools库,而pytools库又需要six,appdirs,d

Windows上搭建hadoop开发环境

前言 Windows下运行Hadoop,通常有两种方式:一种是用VM方式安装一个Linux操作系统,这样基本可以实现全Linux环境的Hadoop运行:另一种是通过Cygwin模拟Linux环境.后者的好处是使用比较方便,安装过程也简单,本篇文章是介绍第二种方式Cygwin模拟Linux环境. 准备工作 (1)安装JDK1.6或更高版本,安装时注意,最好不要安装到带有空格的路径名下,例如:Programe Files,否则在配置Hadoop的配置文件时会找不到JDK. (2)hadoop官网下载