关于HBase的概述

1.hbase的特点

  -》数据存储量可以达到亿级别数据维持在秒级
  -》按列存储的数据库
  -》能够存储上百万列
  -》hbase的底层存储依赖于HDFS
    -》如何扩展hbase,增加DataNode节点
    -》添加一台机器以后,如何保证负载均衡
  -》多版本version,int值

2.特殊概念

  -》namespace:hbase中数据库的概念
  -》列簇:对具有类似属性的列的组,建表时必须至少指明一个列簇
  -》行键:对应的主键
  -》version:创建表的时候指定列簇中的列存储多少个version
  -》timestamp

3.确定值 

  rowkey+列簇:列 -》唯一确定了单元格组
  rowkey+列簇:列 +timestamp -》唯一确定一个单元格的值

  hbase中没有什么数据类型,底层全部是字节

4.HBASE的架构  

  -》底层存储依赖于HDFS
  —》依赖于zookeeper
  -》主从架构
    主节点:Hmaster
    从节点:Hregionserver

时间: 2024-12-16 14:07:52

关于HBase的概述的相关文章

HDInsight HBase的概述

HDInsight HBase的概述 什么是HBase的? HBase的是建立在Hadoop的Apache的开源的NoSQL数据库,提供了大量的非结构化和半结构化数据的随机存取和强大的一致性.它是仿照谷歌的BigTable是一个列面向家庭的数据库.数据被存储在一排内的表和数据的行是由列族分组. HBase的是在这个意义上,无论是列也不存储在其中的数据类型需要在使用它们之前所定义的模式的更小的数据库.开放源代码是首次发布由Mike Cafarella于2007年,线性扩展处理PB级数据数千个节点.

HBase详细概述

本文首先简单介绍了HBase,然后重点讲述了HBase的高并发和实时处理数据 .HBase数据模型.HBase物理存储.HBase系统架构,HBase调优.HBase Shell访问等. 不过在此之前,你可以先了解 Hadoop生态系统 ,若想运行HBase,则需要先搭建好Hadoop集群环境,可以参考此文搭建5个节点的hadoop集群环境(CDH5) . 好了,让我们来学习HBase吧! HBase简介 HBase的发展史 2006年底由PowerSet 的Chad Walters和Jim K

HBase简介

实验简介 我们本节课程将要讲述以下内容: HBase的概述及历史 HBase的数据模型 HBase的系统架构 一.HBase概述 HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java.它是Apache软件基金会的Hadoop项目的一部分,运行于HDFS文件系统之上,为 Hadoop 提供类似于BigTable 规模的服务,可以存储海量稀疏的数据,并具备一定的容错性.高可靠性及伸缩性.主要应用场景是实时随机读写超大规模的数据. H

Hbase原理

Hbase原理 概述 HBase是一个构建在HDFS上的分布式列存储系统:HBase是基于Google BigTable模型开发的,典型的key/value系统:HBase是Apache Hadoop生态系统中的重要一员,主要用于海量结构化数据存储:从逻辑上讲,HBase将数据按照表.行和列进行存储.与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力.Hbase表的特点大:一个表可以有数十亿行,上百万列:无模式:每行都有一个可排序的主键和任意多

HBase中的备份和故障恢复方法

在这篇文章中,你将会对在HBase中可用的数据备份机制有一个高层次的简要了解,并且知道多种数据恢复/容灾机制.在阅读了这篇文章之后,你应该能对你的业务需要那种BDR策略有了自己的判断.你也应该明白各种机制各自的优缺点(适用于CDH 4.3.0/HBase 0.94.6及更高版本). 备份 HBase是一个基于LSM树(log-structured merge-tree)的分布式数据存储系统,它使用复杂的内部机制确保数据准确性.一致性.多版本等.因此,你如何获取数十个region server在H

建立HBase的集群和HDInsight在Hadoop中使用Hive来查询它们

在本教程中,您将学习如何创建和查询HDInsight使用HiveHadoop的HBase的表.下列步骤描述:?如何使用提供在Azure门户的HBase的集群.?如何启用和使用RDP访问HBase的外壳,并使用HBase的外壳创建HBase的示例表,添加行,然后列出表中的行.?如何创建一个Hive表映射到一个现有的HBase的表,使用HiveQL查询数据在HBase的表.?如何使用Microsoft HBase的REST客户端库.NET创建一个新的HBase的表,列出您帐户中的HBase的表,以及

大数据开发实战系列之电信客服(1)

大数据实战开发系列,以实战为主,辅以一些基础知识,关于电信客服,在网上也有很多的资料,这里我自然会去参考网上的资料,程序的整体设计是在今天开始的,老夫尽量在本周末钱结束这个电信客服的程序编写.因为我也是一个学习者,所以在程序编写过程中难免会存在问题,有问题还请大家指出,有则改之,无则加勉.大家共同进步.本教程适合接触大数据开发不久或者还没接触大数据开发,或者小萌新.老鸟就多提意见吧,我改. 博客原文地址:大数据开发实战系列之电信客服(1) 项目背景 关于项目背景,我就照搬网上的了.通信运营商每时

Hbase概述

一.HBASE概述 Hadoop Database NoSQL 面向列 提供实时更新查询 .... 是一个高可靠性 高性能 面向列 可伸缩的分布式存储系统 利用hbase技术可以在廉价的PC上搭建起大规模结构化存储集群. HBase利用HadoopHDFS作为其文件存储系统,利用Hadoop的MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具 行键 - RowKey - 即hbase的主键,访问hbse中的数据有三种方式 通过单一行键访问 通过一组行键访问 全表扫

HBase应用开发回顾与总结系列之一:概述HBase设计规范

  概述 笔者本人接触研究HBase也有半年之久了,虽说不上深入和系统,但至少算是比较沉迷.作为部门里大数据技术的探路者,笔者还要承担起技术传播的职责,所以在摸索研究的过程中总是不断地进行总结和测试,一路走来,慢慢地积累了一些东西,整理了一下,做成一个技术系列文档,暂时就叫做"HBase应用开发回顾与总结".虽然称不上什么高深莫测的技术,但本着开源和分享的精神,笔者本人还是很乐意将它逐篇贴出来.另外,笔者认为<HBase权威指南>算是比较好的HBase方面的技术书籍了,推荐