Hadoop之—— Linux搭建hadoop环境(简化篇)

转载请注明出处:http://blog.csdn.net/l1028386804/article/details/45771619

1、安装JDK(此处以安装JDK1.6为例,具体安装JDK的版本不限)

  (1)下载安装JDK:确保计算机联网之后命令行输入下面命令安装JDK

       sudo apt-get install sun-java6-jdk

  (2)配置计算机Java环境:打开/etc/profile,在文件最后输入下面内容

       export JAVA_HOME = (Java安装目录)

       export CLASSPATH = ".:$JAVA_HOME/lib:$CLASSPATH"

       export PATH = "$JAVA_HOME/:PATH"

  (3)验证Java是否安装成功

  输入 java -version ,输出Java版本信息即为安装成功。

2、安装配置SSH

  (1)下载安装SSH:同样在命令行输入下面命令安装SSH

      sudo apt-get install ssh

  (2)配置无密码登录本机:在命令行输入下面两条命令

     $ ssh-keygen -t rsa -P ‘‘ -f ~/.ssh/id_rsa

直接回车,完成后会在~/.ssh/生成两个文件:id_rsa和id_rsa.pub;这两个成对出现,类似钥匙和锁。

再把id_rsa.pub追加到授权key里面(当前并没有authorized_keys文件)

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

  (3)验证SSH是否安装成功

       输入 ssh localhost 。如果显示本机登录成功就表明安装成功。

3、关闭防火墙

$sudo ufw disable

注意:这步非常重要,如果不关闭,会出现找不到datanode的问题

4、安装运行Hadoop(以0.20.2版本为例)

  (1)下载Hadoop:在http://www.apache.org/dyn/closer.cgi/hadoop/core/页面上下载Hadoop。

  (2)安装配置Hadoop

   单节点配置:

   安装单节点的Hadoop无需配置,在这种方式下,Hadoop被认作为一个单独的Java进程。

   伪分布配置:

   伪分布的Hadoop是只有一个节点的集群。在这个集群中,计算机既是master也是slave,

即使 namenode也是datanode,既是jobtracker也是tasktracker。

  配置的过程如下:

  a、进入conf文件夹修改下面的文件。

  Hadoop-env.sh中加入下面内容:

  export JAVA_HOME = (JAVA安装目录)

  core-site.xml文件内容修改为下面内容:

<configuration>

     <!-- global properties -->
     <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/liuyazhuang/tmp</value>
   </property>

    <!-- file system properties -->
   <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
   </property>
  </configuration>

  hdfs-site.xml文件内容修改为下面内容:(replication默认为3,如果不修改,datanode少于三台就会报错)

<configuration>
   <property>
    <name>fs.replication</name>
    <value>1</value>
   </property>
  </configuration>

mapred-site.xml文件内容修改为下面内容:

<pre name="code" class="html">
  <configuration>
   <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
   </property>
  </configuration>

  b、格式化Hadoop文件系统,在命令行输入命令:  bin/hadoop namenode -format 

          多次格式化先删除 /home/liuyazhuang/tmp(此目录与core-site.xml中配置的目录相同)这个文件夹后在执行格式化操作,

c、启动Hadoop,在命令行输入命令:  bin/start-all.sh  

d、验证Hadoop是否安装成功,在浏览器中输入下面网址,如果正常打开说明安装成功。  

http://localhost:50030 (mapreduce的web页面)  http://localhost:50070 (hdfs的web页面)

5、运行实例

(1)先在本地磁盘建立两个输入文件 file01和file02   $echo "Hello World Bye World" > file01   $echo "Hello Hadoop Goodbye Hadoop" > file02

(2)在hdfs中建立一个input目录:$hadoop fs -mkdir input

(3)将file01和file02拷贝到hdfs中:      $hadoop fs -copyFromLocal /home/liuyazhuang/file0* input

(4)执行wordcount:      $hadoop jar hadoop-0.20.2-examples.jar wordcount input output

(5)完成之后,查看结果      $hadoop fs -cat output/part-r-00000

export JAVA_HOME = /home/chuanqing/profile/jdk-6u13-linux-i586.zip_FILES/jdk1.6.0_13
export CLASSPATH = ".:$JAVA_HOME/lib:$CLASSPATH"
export PATH = "$JAVA_HOME/:PATH"
export HADOOP_INSTALL=/home/chuanqing/profile/hadoop-0.20.203.0
export PATH=$PATH:$HADOOP_INSTALL/bin
export HADOOP_INSTALL=/home/zhoulai/profile/hadoop-0.20.203.0
export PATH=$PATH:$HADOOP_INSTALL/bin
时间: 2024-10-13 12:53:22

Hadoop之—— Linux搭建hadoop环境(简化篇)的相关文章

linux搭建hadoop环境

linux搭建hadoop环境 1.安装JDK (1)下载安装JDK:确保计算机联网之后命令行输入下面命令安装JDK sudo apt-get install sun-java6-jdk (2)配置计算机Java环境:打开/etc/profile,在文件最后输入下面内容 export JAVA_HOME = (Java安装目录) export CLASSPATH = ".:$JAVA_HOME/lib:$CLASSPATH" export PATH = "$JAVA_HOME

linux搭建maven环境

linux搭建maven环境 maven基于java,使用的前提是安装配置好jdk. 下载并配置maven 下载 sudo apt-get install maven 配置 查看安装路径,并记录下来 whereis maven 添加环境变量 sudo vi /etc/profile添加:export M2_HOME=/usr/lib/mavenexport PATH=${M2_HOME}/bin:$PATH保存退出profile执行:source /etc/profile 更改mvn权限 sud

记第一次用Linux搭建LAMP环境

本文为日记,并非技术博客. 嗯,没错,我决定学习linux系统了.虽然不是第一次接触命令行,不过还是挺有压力的.看了两天的Linux基础视频就开始动手搭建自己的LAMP环境. 关于为什么开始接触Linux呢,主要是最近一直在学前端的知识,想换换口味....以前自己写的小网站也都是用windows下的IIS发布的,所以心血来潮决定试试搭建一个Linux的WEB服务器.既然搭建的是WEB服务器,那么首选自然是LAMP环境,也就是Linux+apache+mysql+php啦.至于为什么是LAMP,当

php5.6+apache2.4+linux搭建php环境

前言 最近突然想搭建个人博客,尽管笔者擅长java-web,但综合各种原因,于是选择了大众化的php+mysql搭建个人博客.对于php,只闻其大名,但从未学过,于是,笔者将从php环境搭建开始,到服务器.域名的租赁,php博客模板的选择,一一记录整个过程.计划为学习php用时一个月,租赁服务器和寻找blog模板等相关最终过程耗时一个月.现在就让我们从搭建php环境开始吧.注意,这是在linux服务器上的教程, 已在虚拟机上安装的centos6.4测试成功过,至于windows的,笔者卡在载入模

linux搭建测试环境

搭建测试环境 1.安装JDK1.8 ①下载并上传到/opt/soft目录(soft目录是自己新建的) ②解压:tar -zxvf jdk-8u221-linux-x64.tar.gz 1.解压 2.输入ll查看是否有解压文件 ③配置jdk的环境变量 1.编辑文件:vi /ect/profile 在最后面加入: export JAVA_HOME=/opt/soft/jdk1.8.0_221 export JAVA_BIN=$JAVA_HOME/bin export JAVA_LIB=$JAVA_H

如何在windows和linux搭建django环境

注:本文以python3为例,python2.x是一样的不再赘述 提前准备: python/python3已经安装好,如果没有请参考以下资料进行安装 window安装python3 linux安装python3 window安装django 使用pip进行安装 1.打开cmd窗口 python3 -m pip install django或者指定版本python3 -m pip install django==1.10.3 等待安装完成后打开python3的安装目录,可以看到django的可执行

linux 搭建测试环境之客户端与服务器端连接问题详解

工作中我们用的是公司搭建好的环境,想在家里自己也创建一个服务器做些技术研究,此时就会遇到各种各样的问题,最重要的就是要本机电脑能连接服务器,不然什么都做不了了,现在我们就来解决一下客户端与服务端连通的问题: 第一步:准备好所需工具 VM虚拟机 CRT FileZilla JDK TOMCAT jsp源码 第二步:新建虚拟机 此处就不做详解了,网上都有 第三步:配置linux网络设置 系统网络配置文件的位置 /etc/sysconfig/network-scripts/ifcfg-ens33 使用

linux搭建node环境超详细教程

linux 环境搭建详细步骤 1.访问官方网址:https://nodejs.org/en/download/ 2.选择和你服务器版本相关的压缩包,复制下载链接 3.服务器登录ssh,(这里我用的服务器是centos7,64位的) wget   https://nodejs.org/dist/v8.11.1/node-v8.11.1-linux-x64.tar.xz 4.下载后,你会发现是xz结尾的,用命令 xz -d  node-v8.11.1-linux-x64.tar.xz 然后在 ls

Linux搭建python环境中cx_Oracle模块安装遇到的问题与解决方法

安装或使用cx_Oracle时,需要用到Oracel的链接库,如libclntsh.so.11.1,否则会有各种各样的错误信息. 安装Oracle Instant Client就可得到这个链接库,避免安装几百兆之巨的Oracle Client. 软件下载地址: cx_Oracle的主页:http://cx-oracle.sourceforge.net/ 必需的Oracle链接库的下载地址: 常见的错误和解决方法: 一.win32二进制安装 在windows下安装cx_Oracle-5.0-11g