Hadoop伪分布式的部署

一、部署前的准备

  (1)软件

    一个空白的CentOS映像文件

    Xshell(用于传输文件)

  (2)虚拟机配置

    网络配置:网络适配器选择桥接

    ip地址、子网掩码、网关、DNS服务器地址  =>可以在安装时的图形界面完成配置

    =》也可以 vim /etc/sysconfig/network-script/ifcfg-ens33 修改

    具体如下:

    IPADDR="192.168.124.x" (和网关在同一网段)

    NETMASK="255.255.255.0" (子网掩码也可能在配置文件中显示为 prefix=24)

    GATEWAY="192.168.124.1" (路由器地址)

    DNS1="8.8.8.8"  (谷歌的DNS服务器地址)

    DNS2="144.144.144.144"

    DNS1="223.5.5.5"  (阿里云的DNS服务器地址)

    DNS2="223.6.6.6"

    重启网络 systemctl restart network

    验证网络状况 ping www.baidu.com

    时间同步 ntpdate ntp1.aliyun.com

  (3)关闭虚拟机的安全策略

    防火墙:systemctl stop firewalld

        systemctl disable firewalld

    selinux:getenforce 查看selinux的状态

        vim /etc/selinux/config

        set nu 7 定位第7行

        修改 selinux=disabled

        reboot 重启

  (4)更换yum源

    yum install -y wget  

    mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

    wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

    makecache

  *****多做备份 =》快照**********

  (5)规划

    yum install -y lrzsz

    cd /opt  mkdir 文件名

      install 压缩包

      software 文件解压后

      test 测试

      other 其他

    上传文件:利用rz命令 将jdk-8u144-linux-x64.tar.gz 上传到install目录上去、Hadoop2.7.7.tar.gz 上传到 install目录上去

二、伪分布式集群部署

  (1)java安装

    tar -zxvf jdk-8u144-linux-x64.tar.gz -C software

  (2)Hadoop安装 同上

  (3)环境变量设置 vim /etc/profile

    export JAVA_HOME=/opt/software/jdk8

    export HADOOP_HOME=/opt/software/hadoop-2.7.7

    export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

    export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

    source /etc/profile

    验证java是否安装成功 java -version

  (4) Hadoop伪分布式配置

    ### hadoop-env.sh

    ```shell
    cd /opt/software/hadoop-2.7.7 #进入hadoop-2.7.7目录

    vim etc/hadoop/hadoop-env.sh #编辑配置文件hadoop-env.sh

    export JAVA_HOME=/opt/software/jdk1.8 #修改25行

    export HADOOP_CONF_DIR=/opt/software/hadoop-2.7.7/etc/hadoop #修改33行

    

    ### core-site.xml

    ```xml
    <configuration>

    <!-- 指定HDFS中NameNode的地址 -->
    <property>
    <name>fs.defaultFS</name>
    <value>hdfs://hadoop101:9000</value>
    </property>

    <!-- 指定hadoop运行时产生文件的存储目录 -->
    <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/software/hadoop-2.7.7/tmp</value>
    </property>

    </configuration>
    ```

    ### hdfs-site.xml

    ```xml
    <configuration>
    <!-- 指定HDFS副本的数量 -->
    <property>
    <name>dfs.replication</name>
    <value>1</value>
    </property>

    <property>
    <name>dfs.permissions</name>
    <value>false</value>
    </property>

    </configuration>
    ```

    ### mapred-site.xml

    ```xml
    <!-- 指定mr运行在yarn上 -->
    <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
    </property>
    ```

    ### yarn-site.xml

    ```xml
    <!-- 指定YARN的ResourceManager的地址 -->
    <property>
    <name>yarn.resourcemanager.hostname</name>
    <value>hadoop101</value>
    </property>

    <!-- reducer获取数据的方式 -->
    <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
    </property>
    ```

    ### slaves

    ```
    hadoop101
    ```

    vim /etc/hostname

    hadoop101 192.168.124.x

    ### 格式化文件系统

    ```
    hadoop namenode -format
    ```

    出现Storage directory /opt/software/hadoop-2.7.7/dfs/name has been successfully formatted 表示格式化成功

    启动之前先完成免密登陆

    ssh-keygen

    ssh-copy-id hadoop101

    ### 启动Hadoop

    ```shell

    start-all.sh
    hadoop-daemon.sh start namenode
    hadoop-daemon.sh start datanode
    ```

    验证Hadoop

    jps 检查运行的java进程

    6002 NameNode
    6131 DataNode
    7283 Jps
    6567 NodeManager
    6300 SecondaryNameNode
    6460 ResourceManager   

    ### WEB端查看(可以先用netstat -nltup查看端口)

    ```
    http://192.168.31.54:50070 #查看NameNode的状态
    http://192.168.31.54:50075 #查看DataNode的状态
    http://192.168.31.54:50090 #查看SecondaryNameNode的状态
    ```

原文地址:https://www.cnblogs.com/zhan98/p/12336345.html

时间: 2024-07-30 19:35:47

Hadoop伪分布式的部署的相关文章

hadoop伪分布式系统安装部署

1.软件下载:    wget http://apache.dataguru.cn/hadoop/common/hadoop-2.7.0/hadoop-2.7.0.tar.gz    wget http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz 2.配置安装java:    tar -zxvf jdk-7u79-linux-x64.tar.gz -C /usr/local    cd /us

Hadoop伪分布式模式部署(接单机模式)

一.相关配置文件修改 ①修改core-site.xml: $ su -l hadoop $ cd /usr/local/hadoop/ $ sudo vi etc/hadoop/core-site.xml <configuration>     <property>         <name>fs.defaultFS</name>         <value>hdfs://localhost:9000</value>     &l

Hadoop伪分布模式配置部署

二.Hadoop伪分布式模式配置 本实验需要按照上一节单机模式部署后继续进行操作 1. 配置core-site.xml, hdfs-site.xml,mapred-site.xml及yarn-site.xml 1).修改core-site.xml: $ sudo gvim /usr/local/hadoop/etc/core-site.xml <?xml version="1.0"?> <?xml-stylesheet type="text/xsl"

3-2 Hadoop伪分布模式配置部署

Hadoop伪分布模式配置部署 一.实验介绍 1.1 实验内容 hadoop配置文件介绍及修改 hdfs格式化 启动hadoop进程,验证安装 1.2 实验知识点 hadoop核心配置文件 文件系统的格式化 测试WordCount程序 1.3 实验环境 hadoop2.7.6 CentOS6终端 1.4 适合人群 本课程难度为一般,属于初级级别课程,适合具有hadoop基础的用户. 1.5 相关文件 https://pan.baidu.com/s/1a_Pjl8uJ2d_-r1hbN05fWA

阿里云服务器centos7.3下搭建hadoop伪分布式环境

一.软硬件环境 CentOS 7.2 64位 OpenJDK-1.8.0 Hadoop-2.7 二.安装SSH客户端 安装ssh: yum install openssh-clients openssh-server 安装完成后,使用以下命令测试: ssh localhost输入 root 账户的密码,如果可以正常登录,则说明SSH安装没有问题. 配置SSH免key登陆 hadoop是一个分布式系统,节点间通过ssh通信,为了避免在连接过程中人工输入密码,需要进行ssh免key登陆的配置,由于本

Hadoop伪分布式的搭建

实验平台: Virtual Box 4.3.24 CentOS7 JDK 1.8.0_60 Hadoop 2.6.0 Hadoop基本安装配置主要包括以下几个步骤: 1)创建Hadoop用户 2)安装Java 3)设置SSH登陆权限 4)单机安装配置 5)伪分布式安装配置 1.1 创建Hadoop用户 linux创建用户的命令是useradd,设置密码的命令是passwd 在CentOS下,首先我们通过useradd命令创建一个Hadoop用户组,它的密码也是Hadoop: useradd ha

Hadoop伪分布式环境配置

Step1:关闭防火墙   service iptables stop[status]  service iptables status  chkconfig --list |grep iptables  chkconfig iptables offStep2:修改IP   (重启网卡:service network restart)Step3:修改hostname  /etc/hostsStep4:SSH免密码登陆  产生密钥(~/.ssh中)ssh-keygen -t rsa   cd ~/

Hadoop初体验:快速搭建Hadoop伪分布式环境

0.前言 本文旨在使用一个全新安装好的Linux系统从0开始进行Hadoop伪分布式环境的搭建,以达到快速搭建的目的,从而体验Hadoop的魅力所在,为后面的继续学习提供基础环境. 对使用的系统环境作如下说明: 操作系统:CentOS 6.5 64位 主机IP地址:10.0.0.131/24 主机名:leaf 用户名:root hadoop版本:2.6.5 jdk版本:1.7 可以看到,这里直接使用root用户,而不是按照大多数的教程创建一个hadoop用户来进行操作,就是为了达到快速搭建Had

构建Hadoop伪分布式环境

构建Hadoop伪分布式环境 这篇文章介绍Hadoop伪分布式环境的搭建过程与原理,是个人的学习总结,以纪念在各个步骤中遇到的麻烦.踩过的坑! 这篇笔记包含这样几个内容: 配置伪分布式环境 运行一个简单的作业 可能遇到的问题及解决办法 配置伪分布式环境 本文中的内容基于Hadoop2,即MapReduce作业运行在Yarn平台之上. 打通SSH,实现无密码登陆 由于Hadoop控制脚本需要登陆到集群中的Slave节点执行操作(比如,启动守护进程),如果每一次登录都输入密码,显然不是个好办法.集群