大数据之---hadoop伪分布式部署(HDFS)全网终极篇

1、软件环境
RHEL6 jdk-8u45
hadoop-2.8.1.tar.gz ssh
xx.xx.xx.xx ip地址 hadoop1
xx.xx.xx.xx ip地址 hadoop2
xx.xx.xx.xx ip地址 hadoop3
xx.xx.xx.xx ip地址 hadoop4
xx.xx.xx.xx ip地址 hadoop5

本次部署只涉及伪分布式部署只是要主机hadoop1

2.伪分布式部署
伪分布式部署文档参考官方网站hadoop
Apache > Hadoop > Apache Hadoop Project Dist POM > Apache Hadoop 2.8.3 > Hadoop: Setting up a Single Node Cluster
添加hadoop用户
[[email protected] ~]# useradd hadoop
[[email protected] ~]# vi /etc/sudoers
找到root ALL=(ALL) ALL,添加

hadoop ALL=(ALL) NOPASSWD:ALL

上传并解压
[[email protected] software]# rz #上传hadoop-2.8.1.tar.gz
[[email protected] software]# tar -xzvf hadoop-2.8.1.tar.gz
软连接
[[email protected] software]# ln -s /opt/software/hadoop-2.8.1 /opt/software/hadoop
设置环境变量
[[email protected] software]# vi /etc/profile
export HADOOP_HOME=/opt/software/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
[[email protected] software]# source /etc/profile
设置用户、用户组
[[email protected] software]# chown -R hadoop:hadoop hadoop
[[email protected] software]# chown -R hadoop:hadoop hadoop/
[[email protected] software]# chown -R hadoop:hadoop hadoop-2.8.1
[[email protected] software]# cd hadoop
[[email protected] hadoop]# rm -f .txt
[[email protected] software]# su - hadoop
[[email protected] hadoop]# ll
total 32
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 bin
drwxrwxr-x. 3 hadoop hadoop 4096 Jun 2 14:24 etc
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 include
drwxrwxr-x. 3 hadoop hadoop 4096 Jun 2 14:24 lib
drwxrwxr-x. 2 hadoop hadoop 4096 Aug 20 13:59 libexec
drwxr-xr-x. 2 hadoop hadoop 4096 Aug 20 13:59 logs
drwxrwxr-x. 2 hadoop hadoop 4096 Jun 2 14:24 sbin
drwxrwxr-x. 4 hadoop hadoop 4096 Jun 2 14:24 share*

bin: 可执行文件
etc: 配置文件
sbin: shell脚本,启动关闭hdfs,yarn等配置文件

[[email protected] ~]# cd /opt/software/hadoop
[[email protected] hadoop]# vi etc/hadoop/core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://172.16.18.133:9000</value> # 配置自己机器的IP
</property>
</configuration>

[[email protected] hadoop]# vi etc/hadoop/hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

配置hadoop用户的ssh信任关系

公钥/密钥 配置无密码登录

[[email protected] ~]# ssh-keygen -t rsa -P ‘‘ -f ~/.ssh/id_rsa
[[email protected] ~]# cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
[[email protected] ~]# chmod 0600 ~/.ssh/authorized_keys

[[email protected] ~]# ssh hadoop1 date
Wed Apr 25 15:22:58 CST 2018

[[email protected] ~]# ssh localhost date
Wed Apr 25 15:23:25 CST 2018

第一次执行命令有交互选择输入yes

格式化和启动
[[email protected] hadoop]# bin/hdfs namenode -format
[[email protected] hadoop]# sbin/start-dfs.sh
ERROR:
hadoop1: Error: JAVA_HOME is not set and could not be found.
localhost: Error: JAVA_HOME is not set and could not be found.
解决方法:添加环境变量
[[email protected] hadoop]# vi etc/hadoop/hadoop-env.sh

将export JAVA_HOME=${JAVA_HOME}改为

export JAVA_HOME=/usr/java/jdk1.8.0_45

继续启动

[[email protected] hadoop]# sbin/start-dfs.sh
检查是否成功
[[email protected] hadoop]# jps
8026 Jps
7485 NameNode
7597 DataNode
7807 SecondaryNameNode
访问: http://192.168.137.130:50070

修改dfs启动的进程,以hadoop1启动 启动的三个进程:
namenode: hadoop1 bin/hdfs getconf -namenodes
datanode: localhost datanodes (using default slaves file) etc/hadoop/slaves
secondarynamenode: 0.0.0.0

[[email protected] ~]# cd /opt/software/hadoop
[[email protected] hadoop]# echo "hadoop1" > ./etc/hadoop/slaves
[[email protected] hadoop]# cat ./etc/hadoop/slaves
hadoop1
[[email protected] hadoop]# vi ./etc/hadoop/hdfs-site.xml
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop1:50090</value>
</property>
<property>
<name>dfs.namenode.secondary.https-address</name>
<value>hadoop1:50091</value>
</property>
[[email protected] hadoop]# sbin/stop-dfs.sh
[[email protected] hadoop]# sbin/start-dfs.sh

访问: http://172.16.18.133:50070界面

原文地址:http://blog.51cto.com/chaorenyong/2116627

时间: 2024-10-25 05:16:54

大数据之---hadoop伪分布式部署(HDFS)全网终极篇的相关文章

大数据之---Yarn伪分布式部署和MapReduce案例

1.软件环境 RHEL6 角色 jdk-8u45 hadoop-2.8.1.tar.gz ? ssh xx.xx.xx.xx ip地址 NN hadoop01 xx.xx.xx.xx ip地址 DN hadoop02 xx.xx.xx.xx ip地址 DN hadoop03 xx.xx.xx.xx ip地址 DN hadoop04 xx.xx.xx.xx ip地址 DN hadoop05 本次涉及伪分布式部署只是要主机hadoop01,软件安装参考伪分布式部署终极篇 2.配置yarn和mapre

大数据平台Hadoop的分布式集群环境搭建

1 概述 本文章介绍大数据平台Hadoop的分布式环境搭建.以下为Hadoop节点的部署图,将NameNode部署在master1,SecondaryNameNode部署在master2,slave1.slave2.slave3中分别部署一个DataNode节点 NN=NameNode(名称节点) SND=SecondaryNameNode(NameNode的辅助节点) DN=DataNode(数据节点)2 前期准备 (1)准备五台服务器 如:master1.master2.slave1.sla

Hadoop伪分布式部署

一.Hadoop组件依赖关系: 步骤 1)关闭防火墙和禁用SELinux 切换到root用户 关闭防火墙:service iptables stop 禁用SELinux vim /etc/sysconfig/selinux 设置SELinux=disabled 2)设置静态IP vim /etc/sysconfig/network-scripts/ifcfg-eth0 3)修改主机名(hostname) vim /etc/sysconfig/network 4)IP与hostname绑定 作用:

大数据之伪分布式部署之终极篇

------------------------------软件版本-------------------------------------- RHEL6.8 hadoop2.8.1 apache-maven-3.3.9 ? ? ? findbugs-1.3.9 protobuf-2.5.0.tar.gz jdk-8u45 ------------------------------软件版本--------------------------------------- 1.Hadoop宏观:

构建Hadoop伪分布式环境

构建Hadoop伪分布式环境 这篇文章介绍Hadoop伪分布式环境的搭建过程与原理,是个人的学习总结,以纪念在各个步骤中遇到的麻烦.踩过的坑! 这篇笔记包含这样几个内容: 配置伪分布式环境 运行一个简单的作业 可能遇到的问题及解决办法 配置伪分布式环境 本文中的内容基于Hadoop2,即MapReduce作业运行在Yarn平台之上. 打通SSH,实现无密码登陆 由于Hadoop控制脚本需要登陆到集群中的Slave节点执行操作(比如,启动守护进程),如果每一次登录都输入密码,显然不是个好办法.集群

hadoop学习系列(1.大数据典型特性与分布式开发难点)

第一天 1.大数据典型特性与分布式开发难点 1. 大数据典型特性与分布式开发难点 2. Hadoop框架介绍与搜索技术体系介绍 3. Hadoop版本与特性介绍 4. Hadoop核心模块之HDFS分布式文件系统架构介绍 5. Hadoop核心模块之Yarn操作系统架构介绍 6. Linux安全禁用设置与JDK安装讲解 7. Hadoop伪分布式环境部署HDFS部分 8. Hadoop伪分布式环境部署Yarn和MR部分 9. Hadoop环境使用常见的错误集合 10. Hadoop环境常规设置与

Hadoop伪分布式的部署

一.部署前的准备 (1)软件 一个空白的CentOS映像文件 Xshell(用于传输文件) (2)虚拟机配置 网络配置:网络适配器选择桥接 ip地址.子网掩码.网关.DNS服务器地址 =>可以在安装时的图形界面完成配置 =>也可以 vim /etc/sysconfig/network-script/ifcfg-ens33 修改 具体如下: IPADDR="192.168.124.x" (和网关在同一网段) NETMASK="255.255.255.0"

windows下hadoop的单机伪分布式部署(2)

下面开始hadoop的安装与配置: (1)安装jdk 我安装的是JDK1.7.0_40,windows x64版的 下载完之后,直接点击安装, 我的安装路径为默认路径:C:\Program Files\Java\jdk1.7.0_40: 安装完毕后,设置环境变量: JAVA_HOME指向JDk安装目录 PATH指向JDK的bin目录 设置完成之后,在cmd中 输入java命令,如果出现一下画面,即为安装成功: (2)安装hadoop 下载hadoop,http://hadoop.apache.o

windows下hadoop的单机伪分布式部署(3)

下面介绍myeclipse与hadoop的集成. 我用的myeclipse版本是8.5. 1.安装hadoop开发插件 在hadoop1.2.1版本的安装包contrib/目录下,已经不再提供hadoop-eclipse-pligin-1.2.1.jar; 而是提供了源代码文件,需要我们自行重新编译成jar包文件:这里方便,大家可以从这里下载: hadoop-eclipse-plugin-1.2.1.jar.pdf 由于博客上传文件的类型限制,故添加了pdf后缀,下载之后重命名,去掉".pdf&