Hbase物理模型

?Hbase

? 一种高可靠，面向列，可伸缩，事实读写的分布式数据库。

利用HDFS作为其文件存储系统。

MapReduce处理数据。

Zookeeper分布式协同服务。

数据结构

Row Key：行健。（唯一标识）唯一检索条件

Time Stamp ：时间撮。（版本标识）

Column：列族。（建表时确定）

Row Key检索方式：

1 通过单个row key访问

2 通过row key的range

3 全表扫描

Hbase体系简图

Zookeeper

保证任何时候，集群中只有一个master

? 存贮所有Region的寻址入口。

? 实时监控Region server的上线和下线信息。并实时通知Master

? 存储HBase的schema和table元数据

Hmaster为总控制节点

HMaster没有单点问题，HBase中可以启动多个HMaster，通过Zookeeper的Master Election机制保证总有一个Master在运行

主要负责Table和Region的管理工作：

1 管理用户对表的增删改查操作

2 管理HRegionServer的负载均衡，调整Region分布

3 Region Split后，负责新Region的分布

4 在HRegionServer停机后，负责失效HRegionServer上Region迁移

HreginService：一个物理节点（一台物理节点只能跑一个HreginService），可以管理多个实例HRegin

HLog:r日志。

Hregin可以是不同表的regin 每个表最初只有一个regin，

Hregin由多个store组成

Store：每个表的每个列族，

MemStore：数据刚刚些入时存在内存中的MemStore当达到一定阀值时写入硬盘StoreFile，每次写入形成一个StoreFile，

当StoreFile达到一定阀值时会把当前regin分割成两个，并有Hmaster分配相应的HreginService实现负债均衡，

写入每过一段时间Hbase将进行合并，将过期的，无用的列进行删除，Hfile：对应着HDFS文件。

客户端检索数据时顺序现在MemStore中找，找不到再在StoreFile中找。

来自为知笔记(Wiz)

时间： 2024-12-03 08:19:18

Hbase物理模型的相关文章

HBase基本概念

转自:http://www.bcmeng.com/hbase-basic/ Hbase概述 HBase构建在 HDFS 之上,Hbase内部管理的文件全部存储在HDFS 中 Hbase 特性容量巨大面向列稀疏性:空值不占用存储空间扩展性:热扩展高可靠性高性能 Hbase 表的特点大无模式面向列稀疏对于空( null )的列,并不占用存储空间数据多版本数据类型单一 Hbase中的数据都是字符串,没有类型. hbase数据模型 Row Key 行键,Table的主键,Tab

Hbase原理

Hbase原理概述 HBase是一个构建在HDFS上的分布式列存储系统:HBase是基于Google BigTable模型开发的,典型的key/value系统:HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储:从逻辑上讲,HBase将数据按照表.行和列进行存储.与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力.Hbase表的特点大:一个表可以有数十亿行,上百万列:无模式:每行都有一个可排序的主键和任意多

HBase介绍

HBase是一个分布式,面向对象的开源数据库,该技术来源于Google论文"Bigtable:一个结构化数据的分布式存储系统". 就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在hadoop之上提供了类似于Bigtable的能力. HBase是apache的Hadoop项目的子项目. HBase不同于一般的关系型数据库,它是一个适合于非结构化数据存储的数据库,另一个不同的是HBase基于列的而不是基于行模式. HBase存

初步掌握HBase

1.HBase概述 HBase是hadoop生态系统中的重要组成部分,是一个开源的.面向列.适合存储海量非结构化数据或半结构化数据,具备高可靠性.高性能.可灵活扩展伸缩.支持实时数据读写的分布式存储系统存储在Hbase中的表的特征 1.大:一个表可以有上亿行,上百万列 2.任意模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态的增加,同一张表中的不同的行,它们的列可以不相同 3.面向列:面向列(簇)的存储和权限控制,列(簇)独立检索 4.稀疏:对于为空(NULL)的列,并不占用存储

hadoop学习笔记----- Hbase理论

HBase Hbase是一个分布式的.面向列的开源数据库,该技术来源于Chang et al所写的Google论文"Bigtable:一个结构化数据的分布式存储系统". 就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bittable的能力. HBase是Apache的Hadoop项目的子项目. HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库,另一个不同的是HBase基

Hbase 设计与开发实战

Hbase 概述大数据及 NoSQL 的前世今生传统的关系型数据库处理方式是基于全面的 ACID 保证,遵循 SQL92 的标准表设计模式(范式)和数据类型,基于 SQL 语言的 DML 数据交互方式.长期以来这种基于关系型数据库的 IT 信息化建设中发展良好,但受制于关系型数据库提供的数据模型,对于逐渐出现的,为预先定义模型的数据集,关系型数据库不能很好的工作.越来越多的业务系统需要能够适应不同种类的数据格式和数据源,不需要预先范式定义,经常是非结构化的或者半结构化的(如用户访问网站的日志

Hbase框架原理及相关的知识点理解、Hbase访问MapReduce、Hbase访问Java API、Hbase shell及Hbase性能优化总结

转自:http://blog.csdn.net/zhongwen7710/article/details/39577431 本blog的内容包含: 第一部分:Hbase框架原理理解第二部分:Hbase调用MapReduce函数使用理解第三部分:Hbase调用Java API使用理解第四部分:Hbase Shell操作第五部分:Hbase建表.读写操作方式性能优化总结第一部分:Hbase框架原理理解概述 HBase是一个构建在HDFS上的分布式列存储系统:HBase是基于Google

Hbase原理、基本概念、基本架构

概述 HBase是一个构建在HDFS上的分布式列存储系统;HBase是基于Google BigTable模型开发的,典型的key/value系统;HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储;从逻辑上讲,HBase将数据按照表.行和列进行存储.与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力.Hbase表的特点大:一个表可以有数十亿行,上百万列;无模式:每行都有一个可排序的主键和任意多的列,列可以根据

HBase是什么

HBase是什么? hbase是以列为中心的数据库,而传统关系数据库则是以行为中心的数据库.不过hbase这个列并非我们传统意义的列,而是列族.列族是hbase最小的存储单位,换句话说hbase底层数据都是以列族来进行组织的. Hbase是基于hadoop(hdfs)的分布式数据库系统; HBase是典型的key/value系统: hbase是是建立的hdfs之上,提供高可靠性.高性能.列存储.可伸缩.实时读写的数据库系统. 它介于nosql和RDBMS之间,仅能通过主键(rowkey)和主键的