Hadoop快速入门（Hadoop下载与安装）

Hadoop下载与安装

官网下载

打开Apache Hadoop官方网址http://hadoop.apache.org/

The requested file or directory is not on the mirrors.

It may be in our archive : http://archive.apache.org/dist/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

可以使用迅雷等多线程下载工具来下载，支持断点续传。成功下载后得到hadoop-2.7.3.tar.gz压缩文件，204M。请检查压缩包是否204M，浏览器下载的话可能会中断。

上传至虚拟机

通过ll或ls命令可以查看到已经上传到虚拟机node1上的hadoop-2.7.3.tar.gz压缩文件

解压缩

需要将Hadoop安装到/opt目录下。

通过下面命令直接将hadoop-2.7.3.tar.gz解压缩到/opt目录下

tar -zxvf hadoop-2.7.3.tar.gz -C /opt

通过cd /opt/hadoop-2.7.3命令切换到hadoop根目录，然后通过ll命令查看

目录结构分析

如上图Hadoop的目录结构：

bin ：Hadoop 最基本的管理脚本和使用脚本所在目录，这些脚本是sbin目录下管理脚本的基础实现，用户可以直接使用这些脚本管理和使用Hadoop 。
    etc ：Hadoop 配置文件所在的目录，包括core-site.xml 、hdfs-site.xml 、mapred-site.xml 等从Hadoop 1.0 继承而来的配置文件和yarn-site.xml 等Hadoop 2.0 新增的配置文件。
    include ：对外提供的编程库头文件（具体动态库和静态库在lib 目录中），这些头文件均是用C++ 定义的，通常用于C++ 程序访问HDFS 或者编写MapReduce 程序。
    lib ：该目录包含了Hadoop 对外提供的编程动态库和静态库，与include目录中的头文件结合使用。
    libexec ：各个服务对应的shell 配置文件所在目录，可用于配置日志输出目录、启动参数（比如JVM 参数）等基本信息。
    sbin ：Hadoop 管理脚本所在目录，主要包含HDFS 和YARN 中各类服务的启动/ 关闭脚本。
    share ：Hadoop 各个模块编译后的jar 包所在目录。

原文地址：https://www.cnblogs.com/mtime2004/p/9996716.html

时间： 2024-11-09 00:45:03

Hadoop快速入门（Hadoop下载与安装）

Hadoop下载与安装

官网下载

上传至虚拟机

解压缩

Hadoop快速入门（Hadoop下载与安装）的相关文章

从预装版VM快速入门hadoop

Hadoop快速入门（WordContent简单应用）

win7下Hadoop学习之 Cygwin下载、安装、配置

大数据Hadoop快速入门

大数据学习之Hadoop快速入门

大数据初学者的福利——Hadoop快速入门教程

Hadoop快速入门

Hadoop快速入门01——基本配置

PosttgreSQL快速入门：PostgreSQL的安装和配置