hbase:
分布式——表的逻辑管理,表数据的物理存储
基于HDFS存储
可以通过HBASE自己的API来实现表数据的访问和分析
也可以通过编写MAPREDUCE程序来实现表数据的访问和分析
HBASE:
容量可以线性扩展,理论上没有上限
表结构:
创建表的时候只需要指定表名,列族名就可以了
表中的每一行record,字段数量和类型都可以不一样
每一行record中的数据是以key-value形式存储
每一个value可以保存多个版本,查询时默认返回最新版本
表的物理存储是“列式存储”
查询数据时:
客户端需要指定: 表名--->行键--->列族--->列(字段)--->版本
hbase应用场景(简单、海量):
1、需要数据库的场景(数据量太大,以至于传统RDBMS无法胜任)
----联机业务功能开发(适合逻辑简单的功能)
----离线数据分析(数据仓库 hive更合适)
2、数据量达到一定规模
3、实例:
流量运营系统:历史详单存储和查询
电商系统:历史订单存储和查询
电商系统:商品id --- 商品名称、别名、各种图片的path 。。。
小米:小米云服务
bjrun:hbase存储后续流程的生产数据
短链系统: 短---->长
时间: 2024-12-28 09:44:33