一、HBASE概述
Hadoop Database
NoSQL
面向列
提供实时更新查询
。。。。
是一个高可靠性 高性能 面向列 可伸缩的分布式存储系统
利用hbase技术可以在廉价的PC上搭建起大规模结构化存储集群。
HBase利用HadoopHDFS作为其文件存储系统,利用Hadoop的MapReduce来处理HBase中的海量数据,利用Zookeeper作为协调工具
行键 - RowKey - 即hbase的主键,访问hbse中的数据有三种方式
通过单一行键访问
通过一组行键访问
全表扫描
列族 - Column Family
在建表时声明,不能后期增加,如果需要增加只能alter表,一个列族可以包含一个或多个列
列 - Column
可以动态增加列,不需要提前声明
单元格与时间戳 - cell timestamp
通过row和columns确定的一个存储单元为一个cell。每个cell都保存着一个数据的多个版本,版本通过时间戳来区别。
数据都以二进制形式存储,没有数据类型的区别
时间: 2024-10-06 05:19:52