Hadoop伪分布式集群搭建总结

Hadoop伪分布式集群搭建总结

一、所需软件
VMware15!
CentOS6.5
JDK1.8
Hadoop2.7.3
二、安装
注意:
对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存。

1、关闭防火墙和禁用SELINUX
(1)、永久关闭防火墙,重启Linux系统

(2) 、禁用SELINUX:修改文件参数 重启Linux使其生效

(3)、检查防火墙是否运行,显示下图即为关闭

2、配置hostname与IP地址之间的对应关系
(1)、查看自己的IP

(2)、查看自己的hostname

(3)、配置对应关系

注意:IP与hostname之间有空格
3、创建用户
(1),创建hadoop用户

(2)、为hadoop用户设置密码

4、配置 SSH免密登录
(1)、检查自己系统是否安装SSH

注意:若没安装SSH则在有网的情况下可输入:yum install openssh-server 进行安装。
(2)、为hadoop用户配置SSH免密登录

注意:一定要切换到hadoop用户下并进入“~”目录!

注意:输入ssh-keygen -t rsa后一直回车即可!
然后进入.ssh目录进行以下操作

注意:“authorized_keys”一定要准确!**``**
进入“~”目录为.ssh目录及其文件赋予相应权限

5、JDK安装
(1)、创建存放软件目录

(2)、上传解压jdk

注意:确保红框内权限为hadoop的!如果为root,可进入root用户修改为hadoop, 命令为:chown –R hadoop:hadoop jdk-8u211-linux-x64.tar.gz ,然后重新进入hadoop用户进行解压
(3)、为jdk1.8.0_211创建软连接

(4)、配置bashrc文件

使配置文件生效

(5)、验证JDK是否安装成功,显示下图即为成功

6、hadoop安装及配置
(1)、上传解压hadoop

注意:确保红框内权限为hadoop的!如果为root,可进入root用户修改为hadoop 命令为:chown –R hadoop:hadoop hadoop-2.7.3.tar.gz ,然后重新进入hadoop用户进行解压

(2)、进入hadoop配置文件目录进行相应文件配置

配置core-site.xml vi core-site.xml

注意:箭头所指应为自己的hostname
配置hdfs-site.xml vi hdfs-site.xml

配置hadoop-env.sh vi hadoop-env.sh

注意:此路径为JDK的安装目录
配置mapred-site.xml vi mapred-site.xml

配置yarn-site.xml vi yarn-site.xml

配置slaves vi slaves

注意:此为自己的hostname
(3)、为hadoop-2.7.3创建软连接

(4)、配置bashrc文件

使配置文件生效

(5)、创建hadoop相关数据目录

(6)、格式化Namenode hadoop namenode -format

注意:出现以上2个信息即为成功!如果出现要输入密码等情况,检查自己的SSH免密登录是否配置正确!!!
(7)、启动hadoop伪分布式集群

注意:出现以上信息输入yes即可!!!
(8)、通过jps命令查看hadoop的启动进程

注意:出现以上5个进程即为hadoop伪分布式集群启动成功

原文地址:https://blog.51cto.com/14572091/2441615

时间: 2024-10-11 04:47:16

Hadoop伪分布式集群搭建总结的相关文章

hadoop伪分布式集群搭建与安装(ubuntu系统)

1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链接成功了: 3:修改主机的名称vi /etc/hostname和域名和主机映射对应的关系 vi /etc/hosts,改过之后即生效,自己可以ping一下,我这里ip对应master,比如ping master之后发现可以ping通即可: 4:修改过主机名称和主机名与ip对应的关系之后:开始上传jd

Hadoop伪分布式集群搭建-此文章在个人51.cto转载

一.HDFS伪分布式环境搭建 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统.它和现有的分布式文件系统有很多共同点.但同时,它和其他的分布式文件系统的区别也是很明显的.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的.HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架

Hadoop伪分布式集群的安装部署

一.如何为虚拟机做快照? 1.什么是快照? 快照就是对当前的虚拟机状态进行拍照,保留虚拟机当前状态的操作信息. 2.为什么要为虚拟机做快照? 第一:为克隆不同状态的虚拟机提前做准备. 第二:当对虚拟机的某些操作执行错误而且改正比较麻烦的时候,可以切换到之前正常的虚拟机状态重新进行相关的操作. 3.如何为虚拟机做快照? (1)选择要克隆的虚拟机,然后“右键”,选择“快照”,然后选择“拍摄快照”. (2)可以为快照取个名称,也可以为虚拟机当前的状态做个描述,然后点击“拍摄快照”. 4.如何转到某一特

Hadoop完全分布式集群搭建

Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和调试. 伪分布式模式(Pseudo Distrubuted Mode),使用的是分布式文件系统,守护进程运行在本机机器,模拟一个小规模的集群,在一台主机模拟多主机,适合模拟集群学习. 完全分布式集群模式(Full Distributed Mode),Hadoop的守护进程运行在由多台主机搭建的集群上

ZooKeeper的伪分布式集群搭建以及真分布式集群搭建

zk集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功 和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做master节点.而当原

ZooKeeper的伪分布式集群搭建

ZooKeeper集群的一些基本概念 zookeeper集群搭建: zk集群,主从节点,心跳机制(选举模式) 配置数据文件 myid 1/2/3 对应 server.1/2/3 通过 zkCli.sh -server [ip]:[port] 命令检测集群是否配置成功 和其他大多数集群结构一样,zookeeper集群也是主从结构.搭建集群时,机器数量最低也是三台,因为小于三台就无法进行选举.选举就是当集群中的master节点挂掉之后,剩余的两台机器会进行选举,在这两台机器中选举出一台来做maste

Hadoop全分布式集群搭建(详细)

一.准备物理集群.1.物理集群搭建方式.采用搭建3台虚拟机的方式来部署3个节点的物理集群.2.虚拟机准备.准备一个已近建好的虚拟机进行克隆.(建议为没进行过任何操作的)在要选择克隆的虚拟机上右击鼠标,管理,克隆.在弹出对话框中进行以下操作.(1).下一步.(2).选择虚拟机中的当前状态,下一步. (3).选择创建完整克隆,下一步.(4).输入虚拟机名称,下一步.(5).克隆完成.(6).按照上述步骤再创建一个虚拟机名称为slave02的.3.虚拟机网络配置.由于slave01和slave02虚拟

Kafka 单机和伪分布式集群搭建

感觉自己越来越像个运维了,真的是所有的分布式的中间件基本都搭建了一遍   不得了了. 好 废话少说 , 还是来走Kafka 吧 , 经历了Rocket MQ , Kafka 的搭建真的是简单的不知道多少倍 , RocketMQ  实在 是太麻烦了. 还是老方案 , 先登录官网. https://archive.apache.org/dist/kafka 可以根据官网的指示文档  进行下载. 单机搭建 Step 1:下载代码 > wget https://archive.apache.org/di

Hadoop(二)——分布式集群搭建

前两天和一个朋友在聊天的时候说,很多自学Hadoop的朋友80%都会夭折在集群环境的搭建上,原因吗无在乎:1,没有很好的电脑配置,不能像机房一样用多台电脑搭建起集群:2,对linux的不熟悉,各种小黑窗,linux命令--:3,环境搭建的反锁步骤,需要耐心+细心+认真等等吧.不过吗,我觉的,只要敢于坚持,敢于付出都是会成功的.下边讲述一下我的Hadoop集群搭建过程,由于条件有限,也是在虚拟机中进行的. 一,准备资料: 1,一台笔记本:I5的CPU,4G内存,500硬盘(内存有些小,运行的时候比