1，Hadoop知识储备

Hadoop初学思维导图

1，Hadoop

··· Hadoop：

Hadoop的核心由HDFS和MapReduce组成。HDFS是分布式文件系统，是Hadoop生态圈的分布式数据存储基石；MapReduce是计算组件，会被Spark取代。

··· Hadoop生态圈：

Hadoop生态圈是一系列用来处理大数据的框架或组件，有Hadoop、Hive、Spark、HBase等。

2，HDFS

··· 组成：

HDFS采用主从结构，支持文件形式的数据；HDFS包括一个NameNode节点、若干个DataNode节点和一个Secondary NameNode节点，Hadoop2.2之后可以有多个NameNode节点。

··· NameNode：

NameNode作为主服务器，用来管理文件系统命名空间和客户端对文件的访问操作；NameNode是所有HDFS元数据的管理者，用户的数据不会经过NameNode；NameNode执行文件系统的命名空间，如打开、关闭、重命名文件或目录等，也负责数据块到具体DataNode的映射。存储文件的元数据，以及每个文件的块列表和块所在的DataNode。

··· DataNode：

DataNode管理存储的数据；从内部看，文件被分成若干个数据块，并保存在一组DataNode上；DataNode负责处理文件系统客户端的读写，并在NameNode的统一调度下进行数据库的创建、删除和复制工作。

··· Secondary NameNode：

用来监控HDFS状态的辅助后台程序，每隔一段时间获取HDFS元数据的快照。冷备份。

3，HDFS HA

··· 高可用HDFS，由于HDFS的NameNode存在单点故障，所以需要备份的NameNode。

1，备份的NameNode与活动的NameNode通过日志文件edit实现同步，并且同时只能有一个NameNode是active状态，active可以读写edit，standby只能读edit。热备份。

2，ZooKeeper 负责管理NameNode 的故障转移(状态切换)。每一个NameNode节点上都运行一个ZKFC进程(ZooKeeper的客户端)，ZKFC负责向ZooKeeper 发送本机NameNode 的健康状况。

原文地址：https://www.cnblogs.com/shendeng23/p/12381100.html

时间： 2024-10-17 20:53:56

1，Hadoop知识储备的相关文章

【问题收集·知识储备】Xcode只能选择My Mac，不能选择模拟器如何解决？

网友问题:请问打开一个应用,只能选择My Mac,不能选择模拟器如何解决? 答案: 下面将问答过程记录如下: CHENYILONG Blog 请问打开一个应用,只能选择My Mac,不能选择模拟器如何解决? 网友的问题 09:59:32 请问打开一个应用,只能选择My Mac,不能选择模拟器如何解决? 我的回答 10:00:32 你打开的是别人的应用吧网友的问题 10:00:36 对我的回答 10:01:06 别人的应用,有时候打开xcode是不行的网友的问题 10:01:22 那有没有什

自定义控件知识储备-LayoutParams的那些事

在上一篇文章里,我总结了一下自定义控件需要了解的基础知识:View的绘制流程--<自定义控件知识储备-View的绘制流程>.其中,在View的测量流程里,View的测量宽高是由父控件的MeasureSpec和View自身的LayoutParams共同决定的.MeasureSpec是什么,上一篇文章里已经说得很清楚了(啥,没看过?快去路克路克,(??????)??).而LayoutParams呢?是时候在这里做个了断了. LayoutParams是什么? LayoutParams,顾名思义,就是

阿里知识储备之二——junit学习以及android单元测试

一,junit框架 http://blog.csdn.net/afeilxc/article/details/6218908 详细见这篇博客 juit目前已经可以和maven项目进行集成和测试,而且貌似不需要单独引入junit的组件就可以(maven自身已经引入?) 注意一下以下几个标记 @BeforeClass,@Before,@Test(timeout = 50),@After,@Before,@Test(expected = Exception.class),@After,@Before,

接口测试学习入门（1）--前期知识储备

接口测试前必需知识了解:1.接口测试的原理: 无论用那种测试方法,接口测试的原理是通过测试程序模拟客户端向服务器发送请求报文,服务器接收请求报文后对相应的报文做出处理然后再把应答报文发送给客户端,客户端接收应答报文这一个过程. 2.前期知识储备2.1 http知识了解(详见 http://www.blogjava.net/zjusuyong/articles/304788.html 写的很棒!) http端口号 80,不输入默认就是, https端口号 443,基于SSL https加密原理:

新手程序员必备的知识储备有哪些

很多学习了北风网专业课程的朋友,都能如愿到心仪的相关企业任职,首先,北风网向你们表示祝贺,同时关于新手程序员所需要的知识储备情况,特此总结了一篇文章,以供参考: 1.版本控制系统(VCS) VCS 也许是计算机课程最大的疏漏.这些课程光记得教如何写代码,但却往往忘记教学生如何去管理代码.每一个程序员都应该懂得利用 Git 或 Subversion 有效地创建 repository(仓库),编辑与提交代码,进行分支与合并,了解项目工作流. 2.学会写作身为程序员要写的不只有代码.你还要写项目的发

想要开发自己的PHP框架需要那些知识储备？

作者:安正超链接:https://www.zhihu.com/question/26635323/answer/33812516来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 很多人当听到别人要开发框架的时候第一想法就是,又重复造轮子.其实造轮子的过程是一个快速积累知识的过程,能较快的发现自己的不足,以及学到一些自己未发现的知识点.所以建议在有一定PHP基础的情况下,都去尝试完成一个五脏俱全的基本框架吧. 那么下面分享一下我之前造轮子的过程吧: 1. 尝试试用一个

爬虫知识储备篇---分析http请求

(1).为何需要进行HTTP请求分析答:方便我们编写的爬虫精准定位爬取目标 (2).知识储备 1.什么是抓包? 抓包:抓取客户端与服务器之间进行通信时产生的数据包 2.了解抓包工具:chrome下的开发者模式,使用F12即可打开功能结构分析:(参考文档:http://www.css88.com/doc/chrome-devtools/) Elements(元素面板):用于查看网页源代码HTML中的任一元素,手动修改任一元素的属性和样式且能在浏览器中得到实时反馈 Console(控制台面板):

hadoop知识体系

目录结构知识点还是挺全的,可以按照点学习. 一.Hadoop入门,了解什么是Hadoop 二.分布式文件系统HDFS,是数据库管理员的基础课程 1.Hadoop产生背景 2.Hadoop在大数据.云计算中的位置和关系 3.国内外Hadoop应用案例介绍 4.国内Hadoop的就业情况分析及课程大纲介绍 5.分布式系统概述 6.Hadoop生态圈以及各组成部分的简介 7.Hadoop核心MapReduce例子说明 1.分布式文件系统HDFS简介 2.HDFS的系统组成介绍 3.HDFS的组成部分详

Hadoop 知识

Map Reduce & YARN 简介 Apache Hadoop 是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据.最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (HDFS) 和一个分布式计算引擎,该引擎支持以 MapReduce 作业的形式实现和运行程序. MapReduce 是 Google 推广的一个简单的编程模型,它对以高度并行和可扩展的方式处理大数据集很有用

猜你喜欢

Python3中集合的混合使用

比较简单没什么好说的: list_1 = [1,2,3,4,6,3,2,5,7,8,2,1] list_1 = set(list_1) list_1.add(999) list_2 = set([2, ...

mysql中游标的使用案例详解（学习笔记）

1.游标是啥玩意?简单的说:游标(cursor)就是游动的标识,啥意思呢,通俗的这么说,一条sql取出对应n条结果资源的接口/句柄,就是游标,沿着游标可以一次取出一行.我给大家准备一张图: 2.怎么使 ...

微信公众平台开发教程（三）基础框架搭建

微信公众平台开发教程(三) 基础框架搭建上一章,我们已经初步讲解了微信公众账号开发的基本原理,今天我们来探索设计实现. 首先我们设计了模块层次图,当然图中只是给出一种实现方式,不局限于此.具体见下图 ...

关于64位Debian 7.x下安装VMware Tools的心得

大家好,我是李策,刚在北京达内NSD1408班学Linux不久,在10月4日下午无聊之际,下载了Debian 7来学习,结果在颇费周折的安装完后,又一个重要的问题出现--VMware Tools(以下 ...

.NET综合用户界面套包NetAdvantage

NetAdvantage for .NET控件是一款综合的用户界面套包,包含了Windows Form.WPF.ASP.NET和SilverLight控件,其中最常用的控件有表格.图表.各种编辑器和输 ...

【渗透笔记】拿下某小H网的全过程

自从班上A片小王子的7个T资源被封了以后,本小白为造福全班同学,尝试拿下个小H网,先用webrobot搜某些只有小H网才会出现的关键词本以为直接导出放御剑里跑就行了,然并软.于是用awvs扫了一下, ...

聚集索引、非聚集索引、主键

关于这几个概念的理解首先要知道索引是一种数据结构,这个数据结构是由数据库本身来维护的,当删除.插入.更新数据的时候,索引自身的数据结构也在不断维护中. 索引是基于二叉树的结构来维护的,主要是为了快速 ...

linux常用命令(4)rm命令

rm是一个危险的命令,使用的时候要特别当心,尤其对于新手,否则整个系统就会毁在这个命令(比如在/(根目录)下执行rm * -rf).所以,我们在执行rm之前最好先确认一下在哪个目录,到底要删除什么东西 ...

弹出键盘怎样把tableview往上顶？不遮住输入行

弹出键盘怎样把tableview往上顶?不遮住输入行 - (void)registerForKeyboardNotifications { [[NSNotification ...

LeetCode – Refresh – Clone Graph

1. Use BFS to search the graph. 2. Create a hashtable to record the one to one mapping. 1 /** 2 * De ...

2014-11-24~11-28 工作备忘

c++ new, 应该使用char * p = new(std::nothrow) char[1024]; if(p == nullptr) {...} 否则内存分配失败时,会抛异常,而非返回空 nu ...

Android使用OKHTTP解析JSON数据

为了代码重用,我们首先封装一个类.这个类是HttpUtil HttpUtil.java package com.example.asus.networktest; import okhttp3.OkH ...

HDU 5833 Zhu and 772002（高斯消元）

题意:给n个数,从n个数中抽取x(x>=1)个数,这x个数相乘为完全平方数,求一共有多少种取法,结果模1000000007. 思路:每个数可以拆成素数相乘的形式,例如: x1 2=2^1 * 3 ...

不重复验证码

1 string s ="1234567890zxcvbnmasdfghjklqwertyuiopZXCVBNMASDFGHJKLQWERTYUIOP"; 2 string str ...

knockoutJS学习笔记04：监控属性

一.语法介绍先来看一个简单的例子: <span data-bind="text:name"></span> var obj = {name:ko.obse ...

华为JAVA（面试问题及答案节）

华为JAVA面试题 (后记:我没想到华为面试题是不寻常,,至少对我这种鸟来说是这样.对我个人来说.看看这样的题.可能比看<Think In Java>都还要好.因为这里面有很多的东西,都是 ...

关于ContentProvider（二）

上篇说到了ContentProvider的基本使用方法,实现了软件之间的数据互通.然而,仅此是不够的.有时候我们会希望两个软件(A和B)共同使用同一个ContentProvider里面的数据,因此,我 ...

js-二维数组和多维数组

一.二维数组的表示 myarray[][] 二.二维数组的定义方法一: var a = new Array(); for(var i=0;i<3;i++){ //一维长度为3 a[i] = n ...

三步实现mybatis自定义的typehandler

第一步实现接口TypeHandler<T> @MappedJdbcTypes(JdbcType.TIMESTAMP)//此处如果不使用该注解,在myabtis-config.xml中注册该 ...

php学习之路----数组,多维数组,数组函数

php数组数组基本写作格式: 1:简单形式 Array("aa",12,true,2.2," test",50); 2:完整形式 Array("ti ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.017 s.