Hadoop之——分布式集群安装过程简化版

转载请注明出处:http://blog.csdn.net/l1028386804/article/details/46352315

1.hadoop的分布式安装过程

1.1 分布结构

主节点(1个,是hadoop0):NameNode、JobTracker、SecondaryNameNode

从节点(2个,是hadoop1、hadoop2):DataNode、TaskTracker

1.2 各节点重新产生ssh加密文件

ssh-keygen -t rsa 一路回车

进入/root/.ssh目录 cat id_rsa.pub >> authorized.keys

1.3 编辑各个节点的/etc/hosts，在该文件中含有所有节点的ip与hostname的映射信息

1.4 两两节点之间的SSH免密码登陆

ssh-copy-id -i hadoop1 把公钥拷贝到hadoop1主机

scp /root/.ssh/authorized_keys hadoop1:/root/.ssh/ 把authorized.keys文件拷贝到hadoop1主机下

1.5 把hadoop0的hadoop目录下的logs和tmp删除

1.6 把hadoop0中的jdk、hadoop文件夹复制到hadoop1和hadoop2节点

scp -r /usr/local/jdk hadoop1:/usr/local/

1.7 把hadoop0的/etc/profile复制到hadoop1和hadoop2节点，在目标节点中执行source /etc/profile

1.8 编辑hadoop0的配置文件slaves，改为从节点的hostname，分别是hadoop1和hadoop2

1.9 格式化，在hadoop0节点执行hadoop namenode -format

1.10 启动，在hadoop0节点执行start-all.sh

****注意：对于配置文件core-site.xml和mapred-site.xml在所有节点中都是相同的内容。

2.动态的增加一个hadoop节点

2.1 配置新节点的环境

2.2 把新节点的hostname配置到主节点的slaves文件中

2.3 在新节点，启动进程

hadoop-daemon.sh start datanode

hadoop-daemon.sh start tasktracker

2.4 在主节点执行脚本 hadoop dfsadmin -refreshNodes

3.动态的下架一个hadoop节点

3.1、在hadoop0上修改conf/hdfs-site.xml文件

　　<name>dfs.hosts.exclude</name>

　　<value>/usr/local/hadoop/conf/excludes</value>

</property>

3.2、确定要下架的机器

dfs.hosts.exclude定义的文件内容为,每个需要下线的机器，一行一个。

3.3、强制重新加载配置

#hadoopdfsadmin -refreshNodes

3.4、关闭节点

hadoopdfsadmin -report

可以查看到现在集群上连接的节点

正在执行Decommission，会显示：

DecommissionStatus : Decommission in progress

执行完毕后，会显示：

DecommissionStatus : Decommissioned

3.5、再次编辑excludes文件

一旦完成了机器下架，它们就可以从excludes文件移除了

登录要下架的机器，会发现DataNode进程没有了，但是TaskTracker依然存在，需要手工处理一下

时间： 2024-10-01 02:33:14

Hadoop之——分布式集群安装过程简化版的相关文章

Hadoop之——分布式集群安装过程

转载请注明出处http://blog.csdn.net/l1028386804/article/details/46316051 集群的概念计算机集群是一种计算机系统,它通过一组松散集成的计算机软件和/或硬件连接起来高度紧密地协作完成计算工作. 集群系统中的单个计算机通常称为节点,通常通过局域网连接. 集群技术的特点: 1.通过多台计算机完成同一个工作.达到更高的效率 2.两机或多机内容.工作过程等完全一样.如果一台死机,另一台可以起作用集群模式安装步骤 (在伪分布模式下继续)

Hadoop完全分布式集群安装

转载请注明原地址,谢谢! 本文目的是教大家配置Hadoop的完全分布式的集群,除了完全分布式还有两种分别是单节点和伪分布式部署.伪分布式只需要一台虚拟机,配置的东西也相对较少,大多用作代码调试,大家稍微查阅资料,或者对我的配置进行一些删减,就可以实现伪分布式,所以我这里还是使用完全分布式,开了三台虚拟机,都只分配了1G,1核的默认内存,跑得无压力,所以你的笔记本大概需要4G+的内存,就可以完成这个实验. 基于Hadoop 2.x版本和1.x版本的巨大差异,而我更熟悉1.x版本,所以本次使用的Ha

hadoop3.0.0 分布式集群安装过程

1. 环境主机名 ip 角色 hdp01 192.168.184.61 ResourceManager/NameNode/SecondaryNameNode hdp02 192.168.184.62 NodeManager/DataNode hdp03 192.168.184.63 NodeManager/DataNode (1个namenode 2个datanode) 2.准备工作 windows10(物理机系统) VMware12 workstation(虚拟机软件) centos7.0(

CentOS7+Hadoop2.7.2(HA高可用+Federation联邦)+Hive1.2.1+Spark2.1.0 完全分布式集群安装

1 VM网络配置... 3 2 CentOS配置... 5 2.1 下载地址... 5 2.2 激活网卡... 5 2.3 SecureCRT. 5 2.4 修改主机名... 6 2.5 yum代理上网... 7 2.6 安装ifconfig. 8 2.7 wget安装与代理... 8 2.8

redis3.2.5 分布式集群安装+错误解决过程

redis3.2.5 分布式集群安装详细步骤 --(centos5.X-6.X _X64系统) 版本历史时间版本说明编写者 2015-06-5 1.0 redis3.0.2 分布式集群安装详细步骤崔四超 2016-11-25 1.1 redis3.2.5 分布式集群安装详细步骤崔四超一: redis cluster介绍篇 1:redis cluster的现状目前redis支持的cluster特性(已亲测): 1):节点自动发现 2):slave->master 选举,集群容错 3

超详细从零记录Hadoop2.7.3完全分布式集群部署过程

超详细从零记录Ubuntu16.04.1 3台服务器上Hadoop2.7.3完全分布式集群部署过程.包含,Ubuntu服务器创建.远程工具连接配置.Ubuntu服务器配置.Hadoop文件配置.Hadoop格式化.启动.(首更时间2016年10月27日) 主机名/hostname IP 角色 hadoop1 192.168.193.131 ResourceManager/NameNode/SecondaryNameNode hadoop2 192.168.193.132 NodeManager/

（转）ZooKeeper伪分布式集群安装及使用

转自:http://blog.fens.me/hadoop-zookeeper-intro/ 前言 ZooKeeper是Hadoop家族的一款高性能的分布式协作的产品.在单机中,系统协作大都是进程级的操作.分布式系统中,服务协作都是跨服务器才能完成的.在ZooKeeper之前,我们对于协作服务大都使用消息中间件,随着分布式系统的普及,用消息中间件完成协作,会有大量的程序开发.ZooKeeper直接面向于分布式系统,可以减少我们自己的开发,帮助我们更好完成分布式系统的数据管理问题. 目录 zook

HBase集群安装过程中的问题集锦

1.HRegionServer启动不正常在namenode上执行jps,则可看到hbase启动是否正常,进程如下: [[email protected] bin]# jps26341 HMaster26642 Jps7840 ResourceManager7524 NameNode7699 SecondaryNameNode 由上可见,hadoop启动正常.HBase少了一个进程,猜测应该是有个节点regionserver没有启动成功. 进入节点slave1 ,执行jps查看启动进程: [[e

redis3.0.2 分布式集群安装详细步骤

redis3.0.2 分布式集群安装详细步骤 --(centos5.8 X64系统) 版本历史时间版本说明编写者 2015-06-5 1.0 redis3.0.2 分布式集群安装详细步骤 csc 一: redis cluster介绍篇 1:redis cluster的现状目前redis支持的cluster特性(已亲测): 1):节点自动发现 2):slave->master 选举,集群容错 3):Hot resharding:在线分片 4):进群管理:cluster xxx 5):基于