1.Table中的所有行都是按照RowKey的字典序排列.
2.Table在行的方向上分割为多个HRegion
3.Region按照大小分割.每个表刚开始只有一个Region,随着数据不断的插入表中,Region不断增大,当增大到一个阀值的时候Hregion就会等分为两个HRegion.当Table中的行不断增多,就会有越来越多的Region.
4.HRegion是HBase中分布式存储和负载均衡的最小单元.最小单元是指不同的HRegion 可以分布在不同HRegionServer上,但是同一个HRegion不能分布在不同的server上.
5.Hregion是分布式存储的最小单元,但却不是存储的最小单元.事实上,Hbase由一个或多个Store组成,每个Store保存一个ColumnFamily,每个Store又由一个memStore和0到多个StoreFile组成.
如图:StoreFile将以HFile的形式保存在HDFS|上
时间: 2024-10-29 19:06:21