[转帖]B树索引、位图索引和散列索引

B树索引、位图索引和散列索引

https://blog.csdn.net/huashanlunjian/article/details/84460436

索引在数据结构上可以分为三种B树索引、位图索引和散列索引

B树索引

结构:

特点:

1.索引不存储null值。

更准确的说,单列索引不存储null值,复合索引不存储全为null的值

索引不能存储Null,所以对这列采用is null条件时,因为索引上根本没Null值,不能利用到索引,只

能全表扫描。

为什么索引列不能存Null值呢?将索引列值进行建树,其中必然涉及到诸多的比较操作。Null值

的特殊性就在于参与的运算大多取值为null。这样的话,null值实际上是不能参与进建索引的

过程。也就是说,null值不会像其他取值一样出现在索引树的叶子节点上。

B树索引测试1:NULL是否存在索引上。

create table btree_test(id number,code varchar2(10));

create index idx_btree_test_id on btree_test(id,code);

select object_id from user_objects where object_name=‘IDX_BTREE_TEST_ID‘;

alter session set events ‘immediate trace name treedump level 59097‘;

insert into btree_test values(null,null);

alter session set events ‘immediate trace name treedump level 59097‘;

insert into btree_test values(null,‘1‘);

alter session set events ‘immediate trace name treedump level 59097‘;

insert into btree_test values(1,null);

alter session set events ‘immediate trace name treedump level 59097‘;

然后查看转储文件,admin\数据库名\udump

发现这样的信息:

*** 2013-07-19 14:56:41.827

----- begin tree dump

leaf: 0x140142c 20976684 (0: nrow: 0 rrow: 0)

----- end tree dump

*** 2013-07-19 14:56:54.480

----- begin tree dump

leaf: 0x140142c 20976684 (0: nrow: 1 rrow: 1)

----- end tree dump

*** 2013-07-19 14:57:08.139

----- begin tree dump

leaf: 0x140142c 20976684 (0: nrow: 2 rrow: 2)

----- end tree dump

nrow当前节点所含索引条目的数量(包括delete的条目)

rrow有效的索引条目的数量

可以发现:

插入null,null时,有效的索引条目为0

插入null,1时,   有效的索引条目为1

插入1,null时,   有效的索引条目为2

所以,复合索引只有当要插入的值全为Null时才不能放入存入索引中。

也可以这样看:

SELECT num_rows  FROM user_indexes t   WHERE t.index_name =‘btree_test‘;

2.不适合键值较少的列(重复数据较多的列)。

假如索引列TYPE有5个键值,如果有1万条数据,那么 WHERE TYPE = 1将访问表中的2000个数据块。

再加上访问索引块,一共要访问大于200个的数据块。

如果全表扫描,假设10条数据一个数据块,那么只需访问1000个数据块,既然全表扫描访问的数据块

少一些,肯定就不会利用索引了。

3.前导模糊查询不能利用索引(like ‘%XX‘或者like ‘%XX%‘)

假如有这样一列code的值为‘AAA‘,‘AAB‘,‘BAA‘,‘BAB‘ ,如果where code like ‘%AB‘条件,由于前面是

模糊的,所以不能利用索引的顺序,必须一个个去找,看是否满足条件。这样会导致全索引扫描或者全表扫

描。如果是这样的条件where code like ‘A % ‘,就可以查找CODE中A开头的CODE的位置,当碰到B开头的

数据时,就可以停止查找了,因为后面的数据一定不满足要求。这样就可以利用索引了。

位图索引

就是用位图表示的索引,对列的每个键值建立一个位图。

如test表中有state这样一列,数据如下:

10    20    30    20    10    30    10    30    20    30

那么会建立三个位图,如下:

BLOCK1    KEY=10  1    0    0    0    1    0    1    0    0    0

BLOCK2    KEY=20  1    0    0    0    1    0    1    0    0    0

BLOCK3    KEY=30  1    0    0    0    1    0    1    0    0    0

位图索引特点:

1.相对于B*Tree索引,占用的空间非常小,创建和使用非常快。

位图索引由于只存储键值的起止Rowid和位图,占用的空间非常少。

2.不适合键值较多的列。

3.不适合update、insert、delete频繁的列。

4.可以存储null值。

B*Tree索引由于不记录空值,当基于is null的查询时,会使用全表扫描,而对位图索引列进

行is null查询时,则可以使用索引。

5.当select count(XX) 时,可以直接访问索引中一个位图就快速得出统计数据。

6.当根据键值做and,or或 in(x,y,..)查询时,直接用索引的位图进行或运算,快速得出结果行数

据。

位图测试1:位图索引查询效率(省略)。

位图测试2:修改数据时锁的范围。

create table test_bitmap(id number,state number);

insert into test_bitmap values (1,10);

insert into test_bitmap values (2,10);

insert into test_bitmap values (3,20);

insert into test_bitmap values (4,20);

insert into test_bitmap values (5,10);

insert into test_bitmap values (6,30);

insert into test_bitmap values (7,30);

insert into test_bitmap values (8,20);

insert into test_bitmap values (9,30);

insert into test_bitmap values (10,20);

CREATE BITMAP INDEX INDEX_TESTBITMAP_STATE ON TEST_BITMAP(STATE);

开一个PLSQL窗口(SESSION1),执行

update test_bitmap set state = 20 where id = 1;

另开一个PLSQL窗口(SESSION2),执行

update test_bitmap set state = 20 where id = 2;

或者

update test_bitmap set state = 10 where id = 4;

可以发现,状态为20的所有行被锁定。

散列索引

散列索引是根据HASH算法来构建的索引,所以检索速度很快,但不能范围查询。

散列索引的特点

1.只适合等值查询(包括= <> 和in),不适合模糊或范围查询

原文地址:https://www.cnblogs.com/jinanxiaolaohu/p/11840428.html

时间: 2024-08-28 05:48:17

[转帖]B树索引、位图索引和散列索引的相关文章

索引(B*树索引/位图索引)

索引 功能: 1.强制实施主键约束和唯一约束 2.提高性能 (1)大表,用索引比较快,小表,全表扫描,比较快. (2)排序,如果select语句包括order by.group by.union或其它一些关键字,则必须按顺序排列行 如果有了索引,则可以按正确顺序返回行,而无须首先对它们进行排序 (3)联接表 提示: 对于使用where子句的select语句和任何update.delete或merge语句而言,索引可以起到辅助作用. 但对于Insert语句而言,索引会降低处理速度 使用B*树索引的

索引——位图索引

位图索引非常适合于决策支持系统(Decision Support System,DSS)和数据仓库,它们不应该用于通过事务处理应用程序访问的表.它们可以使用较少到中等基数(不同值的数量)的列访问非常大的表.尽管位图索引最多可达30个列,但通常它们都只用于少量的列. 例如,您的表可能包含一个称为Sex的列,它有两个可能值:男和女.这个基数只为2,如果用户频繁地根据Sex列的值查询该表,这就是位图索引的基列.当一个表内包含了多个位图索引时,您可以体会到位图索引的真正威力.如果有多个可用的位图索引,O

数据库索引-位图索引

在学习hive的时候遇到了位图索引,查了查资料.现则很难管理如下,算是个基础知识的了解吧. 一:概念介绍: 百度百科: 位图索引主要针对大量相同值的列而创建(例如:类别,操作员,部门ID,库房ID等),索引块的一个索引行中存储键值和起止Rowid,以及这些键值的位置编码,位置编码中的每一位表示键值对应的数据行的有无.一个块可能指向的是几十甚至成百上千行数据的位置. 当然百度百科你们懂的...来看看wiki的吧 维基百科: Bitmap indexes have traditionally bee

位图索引

     位图索引主要针对大量相同值的列而创建的索引.(例如:性别), 位图索引相对于传统的B*树索引,在叶子节点上采用了完全不同的结构组织方式.传统B*树索引将每一行记录保存为一个叶子节点,上面记录对应的索引列取值和行rowid信息.而位图索引将每个可能的索引取值组织为一个叶子节点.每个位图索引的叶子节点上,记录着索引键值.该索引键值的起始截止rowid和一个位图向量串.从本质上将,位图索引通过一个bit位来记录一个数据行是否存在对应键值.这种方式存储数据,相对于B*Tree索引,占用的空间非

Atitit 索引技术--位图索引

索引在数据结构上可以分为三种B树索引.位图索引和散列索引 存储原理 编辑 位图索引对数据表的列的每一个键值分别存储为一个位图,Oracle对于不同的版本,不同的操作方式,数据生成均有差别. 对于8i,9i, 下面分3种方式来讨论数据的插入: a.一次插入一行,插入多行后,一次提交; b.每插入一行,提交一次; c.批量插入方式,一次提交; 对于第一种方式,观察位图索引的变化情况. a.假设插入8行相同键值的数据,如果以每行方式插入,然后一次提交,则会生成8个位图 SQL> Insert Into

oracle位图索引

以下内容主要都是关于oracle 10g位图索引,重点是存储,其它优缺点,查询机制等也略微介绍,概因为存储机制是根基.内容主要分四个部分:1)来源于http://blog.chinaunix.net/uid-20687159-id-1894992.html2)来源于http://blog.sina.com.cn/s/blog_4c6fef63010085m8.html3)来自oracle官方文档的和其它一些.  4)个人的试验,看位图索引的情况.-------------------------

Oracle 位图索引

内容简介: 1.位图索引 1.1位图索引使用注意事项; 1.2 使用位图索引; 1.3 位图索引对DML操作的影响; 2.位图连接索引 2.1 明确需求后使用位图索引; 2.1创建位图连接索引的注意事项: 1.位图索引: 1.1位图索引使用注意事项: ? 一般适用于低基数列; ? 适合数据仓库; ? 对于启用位图索引的表,应尽量减少或避免DML操作; ? 如果对一张含有多列位图索引的表进行大量DML操作,应考虑将位图索引删除,DML操作结束后重建位图索引; ? 不适用于频繁持续发生DML操作的O

B树索引和位图索引的区别!

B树索引主键和唯一性约束字段的B树索引,效率几乎和海量数据没有关系. 键值重复率低的字段比较适合使用B树索引. 位图索引键值重复率高的字段比较适合使用位图索引.count.and.or.in这些特定的操作更适合位图索引. DML操作比较多的表不适合使用位图索引. 复合索引在where条件中必须带驱动列,复合索引才会使用. 键值重复率低(DISTINCT数量多)的字段放在前面. 用实验说明为什么位图索引不适合OLTP,比较适合OLAP.即:DML操作比较多的表不适合使用位图索引. 首先创建测试表:

Oracle索引总结(四)- Oracle索引种类之位图索引

位图索引 1.1 位图索引概述 位图索引通过位图向量,表示索引键值在表中的分布. 适用于没有大量更新操作的对象,如:OLAP数据库. 对于存在大量更新操作的索引列,不适用位图索引.因此对于OLTP并不适用. 更新位图向量时,相应位图涉及的所有数据行会被锁定,无法针对这些数据行的该索引列进行DML操作. 1.2 位图索引结构的说明 与B-tree索引的联系及区别如下: 与B-tree索引的联系:位图索引使用B-tree形式组成. 与B-tree索引的区别:位图索引的一个索引键值对应一个叶子节点.(