HDFS HA系列实验之四:HA+Federation

接触了Spark也快有半年了,版本从0.8.0到现在的1.0.0SNAPSHOT,从头到尾被spark这个优秀的框架深深吸引,也为scala的优雅所折服。4.19日“2014 中国Spark技术峰会”召开,可以看出随着Spark技术的完善,越来越多的企业已经开始使用或开始关注Spark的发展了。回顾学习过程,觉得很有必要整理一份学习路线,对所学的内容加以沉淀,同时也为同行作为参考。

因为Spark1.0.0即将发布,增加了很多特性,所以决定修改以前的博文,全都采用Spark1.0.0,计划写40-50篇左右的博文,尽量在7月底完成。

笔者在百度云盘上提供了本人编译的spark1.0.0-SNAPHOT的部署包,还提供了支持Tachyon0.4.1的部署包。实验环境所涉及的软件有:

hadoop 2.2.0

Scala 2.10.4

SBT 0.12.3

Maven 3.0.4

1:原理篇

Spark1.0.0 运行架构基本概念

Spark1.0.0 编程模型

  • Spark1.0.0 编程模型解析

Spark Streaming运行架构基本概念

2:运维篇

部署篇

监控篇

  • Spark1.0.0 UI监控解读
  • 用ganglia监控Spark1.0.0

优化篇

3:Spark生态环境

Spark1.0.0 生态环境简介

Spark on SQL 简介

4:Spark开发

Spark1.0.0 多语言编程

Spark1.0.0 多语言编程之Scala实现

Spark1.0.0 多语言编程之Python实现

5:源码研读

Spark1.0.0 源码研读环境搭建

一张图看懂Spark源码

6:杂记

为什么学习Spark

关于SPARK_WORKER_MEMORY和SPARK_MEM

在csdn上发布一下这博客,看看效果,如果好的话,将163.com上博客搬过来。因为要修改的东西太多,有点犹豫不决。

HDFS HA系列实验之四:HA+Federation

时间: 2024-11-07 04:13:16

HDFS HA系列实验之四:HA+Federation的相关文章

HDFS HA系列实验之二:HA+JournalNode+zookeeper

1:原理图 A:NN1.NN2(或者更多个NN节点)只有一个是Active状态,通过自带ZKFailoverController组件(zookeeper客户端)和zookeeper集群协同对所有NN节点进行检测和选举来达到此目的. B:Active NN 的EditLog 写入共享的JournalNode集群中,Standby NN通过JournalNode集群获取Editlog,并在本地运行来保持和Active NN 的元数据同步. C:如果不配置zookeeper,可以手工切换Active

PVS让存储颤抖,系列博文之四:PVS的写缓存新技术之XenApp方式实测篇

XenApp运行环境 XenApp 6.5运行在Windows 2008 R2上 和运行VDI的测试类似,XenApp的测试方式如出一辙.LoginVSI还是设置为中等负荷,使用同样的用户帐号设置,也是同样的用户配置文件设置.不过用户配置文件我们使用的是优化了的配置文件管理.另外,XenApp虚拟机一般来说数量较少而内存较大,所以我们侧视了几种Cache in RAM with Hard Disk Overflow的大小,包括1GB.3GB以及12GB的内存,测试结果在下面. XenApp 6.

Linux系统架构(LB—HA集群)-HA集群配置

HA集群配置 准备两台设备,分别为主从 主: [[email protected] ~]# ifconfig eth0       inet addr:192.168.137.21 从: [[email protected] ~]# ifconfig eth0      inet addr:192.168.137.23 先开始配置 主上: [[email protected] ~]# hostname master [[email protected] ~]# iptables -F [[ema

【Arduino】37种传感器系列实验(4)---振动传感器模块

---恢复内容开始--- 37款传感器的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器,依照实践(动手试试)出真知的理念,以学习和交流为目的,这里准备逐一做做实验,不管能否成功,都会记录下来---小小的进步或是搞不掂的问题,希望能够抛砖引玉. 实验四:振动传感器模块 手头这模块的实物照片 核心是sw-18015p(18010p) 高灵敏振动传感器 滚珠开关也叫钢珠开关,珠子开关,其实都是震动开关的一种只是叫法不一样是通过珠子滚动接触

【Arduino】66种传感器系列实验(5)---热敏温度传感器模块

37款传感器与模块的提法,在网络上广泛流传,其实Arduino能够兼容的传感器模块肯定是不止37种的.鉴于本人手头积累了一些传感器模块,依照实践(动手试试)出真知的理念,以学习和交流为目的,这里准备逐一做做实验,不管能否成功,都会记录下来---小小的进步或是搞不掂的问题,希望能够抛砖引玉. 实验五:热敏电阻温度传感器模块 手头这模块的实物照片 热敏电阻器是敏感元件的一类,按照温度系数不同分为正温度系数热敏电阻器(PTC)和负温度系数热敏电阻器(NTC).热敏电阻器的典型特点是对温度敏感,不同的温

vSphere部署系列之09——HA和DRS群集管理

群集(Cluster)是将多台物理主机组织起来,群集管理其中所有主机的资源,形成一个大的资源池.群集中的所有的虚拟机可在池中的任意主机上自由移动,并且群集可做到快速扩容和HA故障冗余.群集的前提条件是要有共享存储,所有虚拟机及其配置文件必须驻留在共享存储器上. 在前面的博文章节中,已搭建了比较基础的实验环境,实现了vCenter对ESXi主机的管理,网络管理.共享存储管理.在这种情况下,各物理主机之间的计算资源(CPU.内存)是完全独立的,在某台主机出现问题时,虚拟机的运行得不到保障. 为了达到

Hadoop2 namenode HA + 联邦 + Resource Manager HA 实验

实验的Hadoop版本为2.5.2,硬件环境是5台虚拟机,使用的均是CentOS6.6操作系统,虚拟机IP和hostname分别为: 192.168.63.171    node1.zhch 192.168.63.172    node2.zhch 192.168.63.173    node3.zhch 192.168.63.174    node4.zhch 192.168.63.175    node5.zhch ssh免密码.防火墙.JDK这里就不在赘述了.虚拟机的角色分配是: node

HDFS NN,SNN,BN和HA

转自 http://www.linuxidc.com/Linux/2012-04/58182p3.htm 前言保证HDFS高可用是Hadoop被推广以来很多技术人员一直关心的问题,通过搜索引擎搜索也可以得到很多的方案.恰逢HDFS Federation出炉,本文将一些涉及到有关NameNode.SecondaryNameNode.BackupNode的含义与区别,以及HDFS HA框架做一个总结.除此之外,文章的最后,将介绍Hadoop-0.23.0如何配置NameNode.SecondaryN

基于Docker的Zookeeper+Hadoop(HA)+hbase(HA)搭建

公司要将监控数据存入opentsdb,而opentsdb使用了hbase作为存储.所以想搭建一套高可用的分布式存储来供opentsdb使用. 因为机器有限,所以测试过程中将三台集群的环境安装在docker上. 一:宿主机版本和docker版本 宿主机:Centos7.2  3.10.0-862.14.4.el7.x86_64 docker:Docker version 1.13.1, build 94f4240/1.13.1 二:镜像版本 docker.io/centos 三:创建docker镜