hadoop生态系统介绍

hadoop生态系统如下图所示：

HDFS：

HDFS（Hadoop Distributed File System）是分布式文件系统，是针对谷歌开发的分布式文件系统GFS（Google File System）的开源实现，是Hadoop两大核心组成部分之一。

HDFS有NameNode和DataNode两部分，NameNode是整个文件系统目录，基于内存存储，存储的是一些文件的详细信息，比如文件名、文件大小、创建时间、文件位置等，有且仅有一个；DataNode存储文件的数据信息，也就是文件本身，不过是分割后的小文件。

HDFS是一种底层数据存储方式。Hive与Hbase的数据一般都存储在HDFS上，HDFS为他们提供高可靠性的底层存储支持。

HBase：

HBase是针对谷歌BigTable的开源实现，是一个高可靠、高性能、面向列、可伸缩的分布式数据库，主要用来存储非结构化和半结构化的松散数据。需要注意的是，HBase可以使用本地文件系统而不用HDFS作为底层数据存储方式，不过为了提高数据可靠性和系统的健壮性，发挥HBase处理大数据量等功能，一般都使用HDFS作为HBase的底层数据存储方式。

HBase的运行建立在hadoop上，在hadoop生态系统中，HDFS为HBase提供了高可靠性的底层存储支持，MapReduce为HBase提供了高性能的计算能力，Zookeeper为HBase提供了稳定服务和failover机制。Pig和Hive还为HBase提供了高层语言支持，使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS（关系型数据库）数据导入功能，使得传统数据库数据向HBase中迁移变的非常方便。

HBase是一个开源的Not-Only-SQL的数据库，像其他数据库一样提供随即读写功能。HDFS最适于执行批次分析，而不能满足实时需要，HBase能够处理大规模数据，它不适于批次分析，但它可以向Hadoop实时地调用数据。如果需要实时访问一些数据，就把它存入HBase。

下面再以表格的形式对HDFS和HBase作一个比较：

原文地址：https://www.cnblogs.com/zyb993963526/p/10222976.html

时间： 2024-10-14 06:56:15

hadoop生态系统介绍的相关文章

安装高可用Hadoop生态（一）准备环境

为了学习Hadoop生态的部署和调优技术,在笔记本上的3台虚拟机部署Hadoop集群环境,要求保证HA,即主要服务没有单点故障,能够执行最基本功能,完成小内存模式的参数调整. 1. 准备环境 1.1. 规划克隆3台服务器,主机名和IP如下主机名 IP 软件 hadoop 192.168.154.128 原始虚拟机用于克隆 hadoop1 192.168.154.3 Zookeeper,journalnode Namenode, zkfc, Resourcemanager hadoop2

micro:bit 软件生态系统介绍

micro:bit 软件生态系统介绍这里有大量的软件平台及工具使得许多microbit 计划顺利的进行,这篇文章只是做概略介绍而希望要进一步了解可以到不同计划的专页得到更多的数据. Microbit Shop Overview High Level Programming Languages 高阶程序语言 Compiled Languages 编译语言 Interpreted Langauges 直译语言 Coding environments and IDEs 程序环境及整合接口 From

关于Hadoop生态中的HA方案的一点思考

在给学生授课和搭建Hadoop生态实验环境的过程中,我发现无论是网络上的参考资料.还是来自大数据服务功供应商的运维文档,给出Hadoop的HA解决方案都如出一辙--使用 ZooKeeper 加 Quorum Journal Manager 方案. 诚然,这一方案久经考验,是十分成熟的可靠方案.与NFS方案相比较,它解除了大量写场景下NFS仅支持单个共享编辑目录的系统可用性限制:与Federation方案相比较,则较好地解决了单个joint-namespace中的单点故障问题,因为篱笆内的各nam

安装高可用Hadoop生态（二）安装Zookeeper

2. 安装Zookeeper 2.1. 解压程序 ※ 3台服务器分别执行 tar -xf ~/install/zookeeper-3.4.9.tar.gz -C/opt/cloud/packages ln -s /opt/cloud/packages/zookeeper-3.4.9 /opt/cloud/bin/zookeeper ln -s /opt/cloud/packages/zookeeper-3.4.9/conf /opt/cloud/etc/zookeeper mkdir -p

Hadoop生态上几个技术的关系与区别：hive、pig、hbase 关系与区别

z摘自:http://www.linuxidc.com/Linux/2014-03/98978.htm hadoop生态圈 Pig 一种操作hadoop的轻量级脚本语言,最初又雅虎公司推出,不过现在正在走下坡路了.当初雅虎自己慢慢退出pig的维护之后将它开源贡献到开源社区由所有爱好者来维护.不过现在还是有些公司在用,不过我认为与其使用pig不如使用hive.:) Pig是一种数据流语言,用来快速轻松的处理巨大的数据. Pig包含两个部分:Pig Interface,Pig Latin. Pig可

hadoop生态搭建（3节点）-04.hadoop配置

如果之前没有安装jdk和zookeeper,安装了的请直接跳过 # https://www.oracle.com/technetwork/java/javase/downloads/java-archive-javase8-2177648.html # ==================================================================安装 jdk mkdir -p /usr/java tar -zxvf ~/jdk-8u111-linux-x64

hadoop生态搭建（3节点）-06.hbase配置

# http://archive.apache.org/dist/hbase/1.2.4/ # ==================================================================安装 hbase tar -zxvf ~/hbase-1.2.4-bin.tar.gz -C /usr/local rm –r ~/hbase-1.2.4-bin.tar.gz # 配置环境变量# =====================================

hadoop生态搭建（3节点）-07.hive配置

# http://archive.apache.org/dist/hive/hive-2.1.1/ # ==================================================================安装 hive tar -zxvf apache-hive-2.1.1-bin.tar.gz -C /usr/local mv /usr/local/apache-hive-2.1.1-bin /usr/local/hive-2.1.1 rm –r ~/apach

hadoop生态搭建（3节点）-10.spark配置

# https://www.scala-lang.org/download/2.12.4.html# ==================================================================安装 scala tar -zxvf ~/scala-2.12.4.tgz -C /usr/local rm –r ~/scala-2.12.4.tgz # http://archive.apache.org/dist/spark/spark-2.3.0/ # ==

猜你喜欢

[Java Web]2\Web开发中的一些架构

1.企业开发架构: 企业平台开发大量采用B/S开发模式,不管采用何种动态Web实现手段,其操作形式都是一样的,其核心操作的大部分都是围绕着数据库进行的.但是如果使用编程语言进行数据库开发,要涉及很多诸 ...

kafka-connect-hdfs连接hadoop hdfs时候，竟然是单点的，太可怕了。。。果断改成HA

2017-08-16 11:57:28,237 WARN [org.apache.hadoop.hdfs.LeaseRenewer][458] - <Failed to renew lease ...

第二节模拟实际开发流程

正在构建,扫一扫,敬请期待和玩得来的人在一起玩才叫玩! 和玩不来的人在一起玩,那种感觉就像加班啊! 关注胖个人微信公众账号,希望对各位学生有所帮助! --胖先生回顾: 1.Spring是IoC控制 ...

dom4j xml的生成与解析

这两天在一直写数据接口,涉及到数据xml文件的生成与解析,在此,简单地记录和总结一下. 其实,生成与解析xml文件主要还是运用java中的I/O文件的知识点. 现在大多数的人写xml文件的生成和解析都 ...

CSS Position小结

position 属性规定元素的定位类型.任何元素都可以定位,不过绝对或固定元素会生成一个块级框,而不论该元素本身是什么类型.相对定位元素会相对于它在正常流中的默认位置偏移. position:rel ...

apahce配置虚拟主机的3种方法

一.基于ip 1) ifconfig 查看自己的网卡接口为enp2s0, vi /etc/sysconfig/network-scritps/ifc-enp2s0:0 DEVICE="enp ...

Best Coder #86 1001 Price List（大水题）

Price List Accepts: 880 Submissions: 2184 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 26214 ...

（三）数据库基本操作（创建、查询、修改、删除数据库）

拓展: show warnings; show create database t1; // 显示创建t1时的信息

网络管理常用命令之六 - Pathping 命令详解（图文）

6.pathping命令... 语法:... 不带选项... -n选项... -h选项... -g选项... -p选项... -q选项... -w选项... -i选项... 6.pathping命令 ...

逃离北上广之后，老码农的悲哀（顺便晒下简历，请围观，但请勿人肉，求放过！求无视！）

在此记录一下,逃离北上广之后的五个月后的今日的感想. 前戏: 最近老板出去旅游了,要十几天才回来.由于老婆最近总是在碎碎念,说小孩在成都读不起书,收入降低了这么多,真是不该回来!云云... 顺便说一下 ...

ansile(2)模块之service

ansible service模块参数选项来自官网,如果有出入,以官网为主参数是否必须默认选项说明 arguments no 命令行参数 enabled no yes no 设置服务是否开 ...

SAX - Hello World

SAX 是一种事件驱动的 XML 数据处理模型.对于 DOM 模型,解析 XML 文档时,需要将所有内容载入内容.相比 DOM 模型,SAX 模型更为高效,它一边扫描一边解析 XML 文档.但与 DO ...

java jstack dump 线程介绍解释

最近抽时间把JVM运行过程中产生的一些线程进行了整理,主要是围绕着我们系统jstack生成的文件为参照依据. 前段时间因为系统代码问题,造成性能到了天花板,于是就dump了一份stack出来进行分析 ...

她的坚强来自于她的单薄

蝴蝶是没有罪过的,她的坚强来自于她的单薄.当我们的生命在一只蝴蝶的透明的羽翼缓缓上升时,古老的庄子将精神的大雨滴落在我们的窗台,从此无论何种梦境,我们都相信是蝴蝶悄悄捎来的.蝴蝶为了验证我们肉体的存活 ...

数据采集类

爬虫,又称蜘蛛,是从别的网站抓取资源的一种方法,C#.NET使用爬虫的方法如下: protected string GetPageHtml(string url) { string pageinfo; ...

华为荣耀平板s8-701w刷机记

稀里糊涂地,不知何时,平板的系统被我搞成3G版的,遇到各种问题,充电慢.用电快.卡死.界面逼死人,想找回原来的系统,结果发现,出厂重置还是同样的系统,机内刷ROM点击本地升级没反应,刷机软件又都不支持 ...

Android对话框之Context

代码就这么一段: new AlertDialog.Builder(getApplicationContext(),R.style.MyAlertDialogStyle) .setTitle(" ...

Android快捷开关实现【http://blog.csdn.net/stevenhu_223/article/details/9052083】

在Android源码中,提供的快捷开关相对是比较少的,Android4.0系统默认提供的桌面快捷开关AppWidget上只有5种开关(分别是Wifi开关.蓝牙开关.GPS开关.同步开关.亮度设置开关) ...

HSSFWorkbook + form + HttpServletResponse 实现excel的下载

今天做了excel的导出下载,折腾了一天才发现ajax的dataType里面没有流类型,这就意味着不能用ajax来接受后台传来的输出流.但是可以用动态创建的form来代替. 下面是项目实践的部分源码: ...

lucene包结构

lucene 2.2包结构: analysis不做详细介绍,因为在实际开发中会使用对中文支持的庖丁分词来做为分词器. document:是写索引的时候的非常重要的一个工具,要把原始数据转为一个个doc ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.