新霸哥注意到了在人类随着计算机技术的发展,数据的存储量发生了很大的变化,可以用海量来形容,同时,存储的数据类型也是有多种多样的,网页,图片,视频,音频,电子邮件等等,所以在这中情况下以谷歌旗下的BigTable为代表的新型数据库产生并且迅速发展。Hbase就是BigTable的开源实现,下面新霸哥将详细的为你揭晓HBase相关知识以及相关应用。
互联网时代对数据库的要求和传统的还是有区别的
其中比较突出的一点就是数据量的问题,在数据量非常庞大的今天关系型数据可能无法实现存储并处理海量数据,但是分布式数据库可以实现这些要求的,能够很快的处理数据和存储海量数据。
有一点比较符合现实的情况就是,分布式数据库能够应对高速发展变化的业务需求,在今天这个信息高速发展的今天,当一个互联网产品上线的时候肯定会遇到增加或者减少需求的情况,在这种情况下,关系型数据库已经不能满足需求了,因为关系型数据库数据字段确定后不能再扩展一些相关字段的,只能在新建一张表,这样对于程序的扩展性非常的差的,但是分布式数据库hbase就不一样了,不断业务怎么调整,它都能应对的过来,数据库中的字段你可以随意的添加,扩展性极强,也是现在很多互联网产品首选的数据存储方式,对于后期业务的扩展非常的有益的。
我们知道一个出名的系统肯定会面临这个高并发高吞吐量的问题,我们生活中的一些电商网站比较出名的某猫,在双十一的那天需要面对的用户量可想而知,那是非常庞大的,一般的关系型数据库肯定会崩掉的,不能满足人们的需求的,但是分布式数据库hbase能够很好的处理数据的高并发和高吞吐量。也是电商网站常用的一种数据库之一。
Hbase的特点
新霸哥从官方网站上了解到了Hbase数据库是运行与Hadoop之上的,设计并且实现了高可靠性,高性能,列存储,可伸缩性,实时读写的数据库系统。
面向列是Hbase的一大典型特性,面向列的存储和权限控制,同时列可以独立的检索。在Hbase中一个表可以有上亿行,上百万列,可见其存储的数据量之大。对于为空的列,并不占用存储空间,因此在表的设计的时候可以设计的非常稀疏。
新霸哥发现了Hbase向下提供了数据存储,向上提供了数据运算,也就是说,它既能利用HDFS的存储能力为用户提供数据存储,又能利用MapReduce模型进行大规模的并行数据处理。好了上面就是新霸哥介绍的分布式数据库hbase的一些介绍,如果你还想了解Hbase架构和原理欢迎关注新霸哥。