Hadoop2.2 federnation联盟的搭建

联盟实际上是一个单独的集群,集群里面包含很多的NameService
共享同样的DataNode,同一份数据只上传一份,block块相同,一个集群中删除,另一个集群中还是存在的.同一份数据只是在namespace中注册了一下.
联盟是共享同一个datanode,相同的数据还是一份
viewfs跨隶属于同一个hdfs联盟的hdfs
联盟的好处是扩展了Namenode

搭建federation(多了federation配置)

  ns1的namenode:hadoop4
  ns2的namenode:hadoop5
  datanode:hadoop4,hadoop5,hadoop6

1.1配置文件(hadoop-env.sh,core-site.xml)

  1.1.1 hadoop-env.sh

  export JAVA_HOME=/usr/local/jdk

  1.1.2 core-site.xml

	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://ns1</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/usr/local/hadoop/tmp</value>
	</property>
	<property>
		<name>fs.viewfs.mounttable.default.link./ns1</name>
		<value>hdfs://hadoop4:9000/</value>
	</property>
	<property>
		<name>fs.viewfs.mounttable.default.link./ns2</name>
		<value>hdfs://hadoop5:9000</value>
	</property>

  1.1.3 hdfs-site.xml

	<property>
		<name>dfs.replication</name>
		<value>2</value>
	</property>
	<property>
		<name>dfs.nameservices</name>
		<value>ns1,ns2</value>
	</property>
	<property>
		<name>dfs.ha.namenodes.ns1</name>
		<value>hadoop101</value>
	</property>
	<property>
		<name>dfs.namenode.rpc-address.ns1.hadoop101</name>
		<value>hadoop4:9000</value>
	</property>
	<property>
		<name>dfs.namenode.http-address.ns1.hadoop101</name>
		<value>hadoop5:50070</value>
	</property>
	<property>
		<name>dfs.ha.namenodes.ns2</name>
		<value>hadoop102</value>
	</property>
	<property>
		<name>dfs.namenode.rpc-address.ns2.hadoop102</name>
		<value>hadoop5:9000</value>
	</property>
	<property>
		<name>dfs.namenode.http-address.ns2.hadoop102</name>
		<value>hadoop5:50070</value>
	</property>

  1.1.6 slaves

	hadoop2
	hadoop3
	hadoop4

  1.2 删除其他节点的hadoop文件夹,然后把hadoop4上的hadoop文件夹复制到hadoop4、hadoop5、hadoop6节点
  1.3 格式化namenode、启动namenode
    在hadoop4上执行hadoop/bin/hdfs namenode -format -clusterId clusterid1
    在hadoop4上执行hadoop/sbin/hadoop-daemon.sh start namenode

    [[clusterId的值与hadoop4上执行的clusterId的值完全相同。如果不同,就不属于同一个federation]]
    在hadoop5上执行hadoop/bin/hdfs namenode -format -clusterId clusterid1
    在hadoop5上分别执行hadoop/sbin/hadoop-daemon.sh start namenode
  1.4 启动datanode
    在hadoop4上执行hadoop/sbin/hadoop-daemons.sh start datanode
  1.5 启动resourcemanager和nodemanager
    在hadoop4上执行 hadoop/sbin/start-yarn.sh start resourcemanager

1.2.验证:

  viewFS是跨隶属于同一个federation的多个hdfs的文件管理系统。
  使用hadoop4:50070/dfsclusterhealth.jsp查看集群情况
  使用hadoop/bin/hdfs dfs -ls viewfs:///统一查看联邦中的数据内容

时间: 2024-08-28 12:11:24

Hadoop2.2 federnation联盟的搭建的相关文章

Ubuntu14.04下Hadoop2.2.0集群搭建

系统版本: master: Ubuntu 14.04  salve1: Ubuntu 14.04 hadoop: hadoop 2.2.0 1.系统配置以及安装SSH无密码登陆环境(master&slaves): 修改本机(master)和子节点(slaveN)机器名:打开/etc/hostname文件 sudo gedit /etc/hostname (修改后需重启才能生效) 修改host文件(映射各个节点IP): sudo gedit /etc/hosts 在后面添加内容为: 172.22.

vmware10上三台虚拟机的Hadoop2.5.1集群搭建

? 由于官方版本的Hadoop是32位,若在64位Linux上安装,则必须先重新在64位环境下编译Hadoop源代码.本环境采用编译后的hadoop2.5.1 . 安装参考博客: 1 http://www.micmiu.com/bigdata/hadoop/hadoop2x-cluster-setup/ 2 http://f.dataguru.cn/thread-18125-1-1.html 3 http://blog.sina.com.cn/s/blog_611317b40100t5od.ht

Hadoop2.6集群环境搭建

Hadoop2.6集群环境搭建(HDFS HA+YARN)原来4G内存也能任性一次. 准备工作: 1.笔记本4G内存 ,操作系统WIN7 (屌丝的配置) 2.工具VMware Workstation 3.虚拟机:CentOS6.4共四台 虚拟机设置: 每台机器:内存512M,硬盘40G,网络适配器:NAT模式 选择高级,新生成虚机Mac地址(克隆虚拟机,Mac地址不会改变,每次最后手动重新生成) 编辑虚拟机网络: 点击NAT设置,查看虚机网关IP,并记住它,该IP在虚机的网络设置中非常重要. N

Hadoop2.6集群环境搭建(HDFS HA+YARN)

Hadoop2.6集群环境搭建(HDFS HA+YARN)原来4G内存也能任性一次. 准备工作: 1.笔记本4G内存 ,操作系统WIN7 (屌丝的配置) 2.工具VMware Workstation 3.虚拟机:CentOS6.4共四台 虚拟机设置: 每台机器:内存512M,硬盘40G,网络适配器:NAT模式 选择高级,新生成虚机Mac地址(克隆虚拟机,Mac地址不会改变,每次最后手动重新生成) 编辑虚拟机网络: 点击NAT设置,查看虚机网关IP,并记住它,该IP在虚机的网络设置中非常重要. N

hadoop2.2.0伪分布式搭建

一.准备linux环境 1.更改VMware适配器设置 由于是在单机环境下进行学习的,因此选择适配器模式是host-only模式,如果想要联网,可以选择桥接模式,配置的方式差不多. 点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.85.0 子网掩码:255.255.255.0 -> apply -> ok 回到windows --> 打开网络

Dockerfile完成Hadoop2.6的伪分布式搭建

在 <Docker中搭建Hadoop-2.6单机伪分布式集群>中在容器中操作来搭建伪分布式的Hadoop集群,这一节中将主要通过Dokcerfile 来完成这项工作. 1 获取一个简单的Docker系统镜像,并建立一个容器. 1.1 这里我选择下载CentOS镜像 docker pull centos 1.2 通过docker tag命令将下载的CentOS镜像名称换成centos,并删除老标签 docker tag docker.io/centos centosdocker rmr dock

Hadoop2.6集群环境搭建(伪分布式)

本文地址:http://www.cnblogs.com/myresearch/p/hadoop-fully-distributed-operation.html,转载请注明源地址. 以前安装过hadoop几个版本的单机版,主要是为了研究hadoop源代码,现在想更加深入hadoop整个生态系统,选择安装hadoop完全分布式,由于目前hadoop最新版本为2.6,于是选择这个版本安装使用 准备工作: 1.笔记本4G内存 ,操作系统WIN7(纯屌丝配置) 2.工具:VMware Workstati

HDFS联盟的搭建

  ---------------------------------------------------------------------------------------------- 3.搭建federation(多了federation配置) ---------------------------------------------------------------------------------------------- nameservice ns1的namenode:ha

Hadoop2.6.0单机模式搭建

1.下载安装jdk 下载jdk1.6.0_39_x64.bin ./jdk1.6.0_39_x64.bin 执行文件 2.配置环境变量 vim /etc/profile 追加: export JAVA_HOME=/root/hadoop/jdk1.6.0_39export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/libexport PATH=$PATH:$JAVA_HOME/bin 让环境变量生效 source /etc/prof