Hadoop 在ubuntu系统上的搭建[图解]

前言

  本文介绍如何在Ubuntu Kylin操作系统上搭建Hadoop平台。

配置

  1. 操作系统: Ubuntu Kylin 14.04

  2. 编程语言支持: JDK 1.8

  3. 通信协议支持: SSH

  2. 云计算项目: Hadoop 1.2.1

第一步:安装最新版本的JDK (若已经安装过请忽略这一步)

  1. 去官网下载JDK1.8并解压 (当前安装包为:jdk-8u25-linux-x64.gz)

  2. 将解压后的安装包复制到 /usr/lib/jvm 目录下 (jvm目录需要自行创建)

  3. 以管理员方式打开 /etc/profile 文件并在文件底部添加以下代码:

1 #set Java Environment
2 export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_25
3 export CLASSPATH=".:$JAVA_HOME/lib:$CLASSPATH"
4 export PATH="$JAVA_HOME/bin:$PATH"

  4. 执行以下命令使配置文件立即生效:

1 source /etc/profile

  5. 执行以下命令验证JDK是否安装成功:

1 java -version

  若显示以下信息表示安装完成:

   

第二步:配置SSH免密码登陆

  1. 输入以下命令安装SSH

1 sudo app-get install ssh

  2. 检查用户目录下是不是有个.ssh的隐藏文件夹,没有的话就自己创建一个。

  3. 执行以下命令配置SSH无密码登陆 (这几行代码的功能请参考SSH使用文档):

1 ssh-keygen -t dsa -P ‘‘ -f ~/.ssh/id_dsa
2 cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

  4. 执行以下命令验证SSH是否安装配置成功:

1 ssh localhost

  出现提示输入yes,若终端显示以下信息,表示SSH配置成功:

  

第三步:安装并运行Hadoop

  说明:Hadoop有三种运行方式 - 单机模式,伪分布式和完全分布式。其中,前两者主要用于程序的测试和调试,这里要讲的是伪分布式的配置,配置完全分布式的方法将在以后讲解。

  1. 下载并解压最新版本的Hadoop到当前目录下 (当前安装包为:hadoop-1.2.1.tar.gz)

  2. 进入conf子目录中,修改如下配置文件:

    a. hadoop-env.sh

    在末尾设置JAVA路径:

1 export JAVA_HOME=/usr/lib/jvm/jdk1.8.0_25

    b. core-site.xml

    配置为:

 1 <?xml version="1.0"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3
 4 <!-- Put site-specific property overrides in this file. -->
 5
 6 <configuration>
 7         <property>
 8                 <name>fs.default.name</name>
 9                 <value>hdfs://localhost:9000</value>
10         </property>
11 </configuration>

    c. hdfs-site.xml

    配置为:

 1 <?xml version="1.0"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3
 4 <!-- Put site-specific property overrides in this file. -->
 5
 6 <configuration>
 7         <property>
 8                 <name>dfs.replication</name>
 9                 <value>1</value>
10         </property>
11 </configuration>

    d. mapred-site.xml

    配置为:

 1 <?xml version="1.0"?>
 2 <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
 3
 4 <!-- Put site-specific property overrides in this file. -->
 5
 6 <configuration>
 7         <property>
 8                 <name>mapred.job.tracker</name>
 9                 <value>localhost:9001</value>
10         </property>
11 </configuration>

  3. 进入Hadoop文件夹执行以下命令以格式化Hadoop文件系统HDFS:

1 bin/hadoop namenode -format

  4. 执行以下命令以启动所有Hadoop进程:

1 bin/start-all.sh

  5. 验证Hadoop是否安装成功

    a. 打开浏览器,输入网址 http://localhost:50030 以查看MapReduce的Web页面:

    

    b. 打开浏览器,输入网址 http://localhost:50070 以查看HDFS的Web页面:

    

    如果显示正常,那么Hadoop环境便搭建好了。

小结

  1. 伪分布式的架构,机制和真实分布式其实是一样的,不过伪分布式中,Master和Slave都是一台机器。

  2. 关于真实分布式环境的搭建,将在以后介绍。到时会在虚拟机上组建一个虚拟网络,跑真正的分布式程序。

时间: 2024-12-28 00:54:57

Hadoop 在ubuntu系统上的搭建[图解]的相关文章

[Hadoop] 在Ubuntu系统上一步步搭建Hadoop(单机模式)

1 创建Hadoop用户组和Hadoop用户 Step1:创建Hadoop用户组: ~$ sudo addgroup hadoop Step2:创建Hadoop用户: ~$ sudo adduser -ingroup hadoop hadoop 回车后会提示输入密码,这是新建Hadoop的密码,输入两次密码敲回车即可.如下图所示: Step3:为Hadoop用户添加权限: ~$ sudo gedit /etc/sudoers 点击回车后,打开sudoers文件,在 root ALL=(ALL:A

在Ubuntu系统上搭建Hadoop 2.x(2.6.2)

官方的中文版的Hadoop快速入门教程已经是很老的版本了,新版的Hadoop目录结构发生了变化,因此一些配置文件的位置也略微调整了,例如新版的hadoop中找不到快速入门中提到的conf目录,另外,网上有很多教程也是关于老版本的.本教程主要是针对Hadoop 2.X版本,在Ubuntu系统上的搭建过程.如果要对各个步骤进行深入理解,还需要参考其他资料. 英文版快速入门:http://hadoop.apache.org/docs/r2.6.2/hadoop-project-dist/hadoop-

Ubuntu系统上SVN服务器的安装和配置

Ubuntu系统上SVN的安装和配置 1.安装 #sudo apt-get install subversion 2.创建版本库 #sudo mkdir /home/svn #sudo svnadmin create /home/svn/suc 3.进入版本库修改相关配置文件 #cd /home/svn/suc/ #dir conf db format hooks locks README.txt 我们主要关心的是conf和db文件,conf文件夹下是存放主配置文件和用户.权限位置,db文件夹是

Nginx: ubuntu系统上如何判断是否安装了Nginx?

问题描述:ubuntu系统上,如何查看是否安装了Nginx? 解决方法:输入命令行:ps -ef | grep nginx master process后面就是Nginx的安装目录. 延伸:1. 如何查看Nginx版本号? 使用命令:nginx -v   //显示Nginx版本号 nginx -V  // 显示Nginx版本号,编译器版本号,配置信息 2. master process:主进程 worker process:工作进程 参考:https://zhidao.baidu.com/que

十分钟内在Ubuntu系统上搭建Mono开发环境(Mono软件Ubuntu系统国内镜像源、Mono国内镜像源)

Mono软件Ubuntu系统国内镜像源.Mono国内镜像源 http://download.githall.cn/repo 1.授权注册repo源 Ubuntu 18.04 (i386, amd64, armhf, arm64, ppc64el)系统请运行如下命令: sudo apt install gnupg ca-certificates sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-keys 3FA7E0

ubuntu系统上使用Mingw编译Qemu最新版

编译概述 当使用某种操作系统(windows.linux或Mac os X)时,我们不仅可以编译可在该系统运行的程序,也可以编译运行去其他平台的程序(如在linux系统上编译运行于windows.iOS.Android等系统的程序),后者就是所谓的交叉编译(cross-compile)技术. 一般来说,编译一个程序首先需要提供如下三类资源 1). 编译器 2). 目标程序依赖的库或头文件 3). 目标程序源码 目前最广泛使用的编译器就算gcc了,gcc是一个支持多种目标系统的跨平台编译器家族,包

Ubuntu系统上轻松截图的几种方法介绍

相信大家对于屏幕截图(或称抓图)应该不会陌生,在Windows平台上,我们可以使用许多第三方的专业抓图软件如SnagIt等来实现抓取屏幕图像的功能.在Ubuntu系统中,实现抓图功能的开源工具很多,用好这些工具可以让我们轻松获取任何所需的屏幕图像.本文介绍基于Ubuntu desktop 8.10(i386),GNOME集成桌面环境. 1.使用键盘快捷键抓图 在GNOME集成桌面环境下,我们可以使用键盘功能键Print Screen或Alt+Print Screen组合键来抓图,前者可以抓取整个

两台装有Ubuntu系统的服务器搭建VPN(一台为本地服务器,另一台为云服务器)

我们搭建VPN采用的是openvpn,搭建过程总体需要经过三大步骤:   1.openvpn的安装与配置    2.端口转发    3.系统重启iptables规则自动生效  注意:以下所有名令在root权限下输入(进入root权限命令 sudo su) 一.openvpn的安装与配置 openvpn安装与配置教程,此链接中的内容介绍了openvpn的安装与配置步骤(图文并茂) 二.端口转发 第一步完成后,本地服务器与云服务器组成了一个局域网(我们配置后的本地服务器虚拟网卡IP为10.8.0.6

Altas在Ubuntu系统上的安装部署步骤

1.下载安装: wget https://github.com/Qihoo360/Atlas/releases/download/2.2/Atlas-2.2-debian7.0-x86_64.deb dpkg   --instdir=/srv/Altas-2.2 -i Atlas-2.2-debian7.0-x86_64.deb 2.配置atlas Vi /usr/local/mysql-proxy/conf/test.cnf [mysql-proxy] #管理接口的用户名 admin-user