hbase功能与架构

  • 什么是hbase

    • hbase是一个高可靠性、高性能、高吞吐量、面向列、可伸缩的分布式数据库,设计的最初目的是用来解决关系型数据库在处理海量数据时的局限性。
  • hbase特性
    • 海量数据(TB\PB)
    • 高吞吐量
    • 高性能(海量数据中实现高效随机读取)
    • 可伸缩
    • 能够同时处理结构化和非结构化的数据
    • 不需要拥有传统数据库所具备的ACID(Atomic:原子性、Consistency:一致性、Lsolation:隔离性、Durability:持久性)特性
  • hbase网络部署
    • master 负责管理网络拓扑、维护集群的负载均衡
    • regionserver 数据的读写,一般与datanode合设
    • zookeeper 分布式协调服务,提供分布式锁
    • hdfs 分布式文件系统,是hbase数据的物理存储单元
  • hbase的功能架构可以参考小石头的博文,我觉得写得非常好
时间: 2024-10-29 19:06:39

hbase功能与架构的相关文章

Hbase入门笔记----架构以及应用介绍

Hbase全称为Hadoop Database,即Hbase是Hadoop的数据库,是一个分布式的存储系统.Hbase利用Hadoop的HDFS作为其文件存储系统,利用Hadoop的MapReduce来处理Hbase中的海量数据.利用zookeeper作为其协调工具. 本篇文章将重点介绍Hbase三个方面的内容:Hbase体系结构(架构)的介绍.Hbase shell的操作.Hbase的Java api的客户端操作. (一)Hbase的架构介绍 Hbase的体系结构是一个主从式的结构,主节点Hm

基于HBASE的并行计算架构之rowkey设计篇

1.大数据在HBASE存储.计算以及查询的应用场景 海量数据都是事务数据,事务数据都是在时间的基础上产生的.数据的业务时间可能会顺序产生,也可能不会顺序产生,比如某些事务发生在早上10点,但是在下午5点才结束闭并生成出来,这样的数据就会造成存储加载时的时间连续性.另外海量数据的挖掘后产生的是统计数据,统计数据也有时间属性,统计数据如果进行保存必须保证在统计计算之后数据尽量不再变化,如果统计发生后又有新的事务数据产生,那么将重新触发统计计算然后重新保存覆盖原有已经存储的数据.其它数据则主要是以配置

Hbase 之 HBase 的整体架构

HBase 系统架构图 组成部件说明  Client:  使用HBase RPC机制与HMaster和HRegionServer进行通信  Client与HMaster进行通信进行管理类操作  Client与HRegionServer进行数据读写类操作  Zookeeper:  Zookeeper Quorum存储-ROOT-表地址.HMaster地址  HRegionServer把自己以Ephedral方式注册到Zookeeper中,HMaster随时感知各个HRegionServer的健康状

HBase表的架构原理

HBase整体架构图 Hbase Table的基本单位是Region,一个Table对应多个Region,Table层级关系如下: Table       (HBase table) Region       (Regions for the table) Store          (Store per ColumnFamily for each Region for the table) MemStore         (MemStore for each Store for each

Flask blueprint蓝图按功能模块化架构实例

使用flask作为开发框架,一定要按功能模块化,否则到了后面项目越大,开发速度就越慢. 1.Flask模块化结构规划 [[email protected] yangyun]# tree . ├── asset               #资产功能目录 │   ├── __init__.py │   ├── models.py        #资产数据库结构文件 │   └── views.py         #资产视图文件 ├── user                #用户功能目录 │ 

利用hive-hbase表做hive表快速入库hbase功能,纬度表的查询

有个需求是纬度表需要秒出数据,首先表刚好也是1-1批对的情况,首先想到了利用hbase的索引机制.(表数据大概在4--30E之间) 虽然网上有很多直接建立hive表,自动创建hbase表的例子,但是这种情况不能进行hbase表的region预分区,导致热点问题比较严重.所以hive和hbase表要分开建立再关联起来. 1.建立hbase表 create 'xxxxx', {NAME => 'info',COMPRESSION => 'SNAPPY'},SPLITS => ['xxx|',

HBase功能组件

原文地址:https://www.cnblogs.com/fanweisheng/p/11253743.html

深入解析物联网操作系统(架构/功能/实例分析)

?? 1.       物联网的主要特点 i.             连接 所谓连接,指的是各种各样的终端设备,都能够通过某种网络技术,连接到一个统一的网络上.任何终端之间都可以相互访问.下一代的基础通信网络,包括未来的5G,通信网络架构重构等,为物联网提供泛连接网络是核心目标.目前也已经有很多厂商推出解决方案,比如Google的thread/wave,华为的Hi-Link,以及NB-IoT等. 传统的物联网连接,都是指物联网终端设备与物联网云平台之间的连接,如下图: 在这种模式下,物联网设备

(二)springmvc+mybatis+zookeeper分布式架构 整合 - 平台功能导图

构建dubbo分布式平台的技术选型.目标.特点.独立服务项目等,今天针对于独立服务项目提供平台功能导图,也是我们未来逐步研发的功能. 架构代码下载:我这边不做多介绍,直接上图了: 下面的章节中,我们会针对于不同的平台提供不同的解决方案和实施步骤,会详细记录每一个细节点,希望能够帮助大家一起学习! 原文地址:http://blog.51cto.com/13568887/2070564