位图索引

     位图索引主要针对大量相同值的列而创建的索引。(例如:性别), 位图索引相对于传统的B*树索引,在叶子节点上采用了完全不同的结构组织方式。传统B*树索引将每一行记录保存为一个叶子节点,上面记录对应的索引列取值和行rowid信息。而位图索引将每个可能的索引取值组织为一个叶子节点。每个位图索引的叶子节点上,记录着索引键值、该索引键值的起始截止rowid和一个位图向量串。从本质上将,位图索引通过一个bit位来记录一个数据行是否存在对应键值。这种方式存储数据,相对于B*Tree索引,占用的空间非常小,创建和使用非常快. 这样做对比传统的B*树索引空间节省高。而且可以借助计算机位图运算的快速特性来提高索引结果利用率。

一、位图索引的创建

创建语法很简单,就是在普通索引创建的语法中index前加关键字bitmap即可,例如:

create bitmap index emp_job_bitmap_idx on emp(job);

二、位图索引的原理

1、 索引块的一个索引行中存储键值、起止Rowid,以及这些键值的位置编码,

2、 位置编码中的每一位表示键值对应的数据行的有无.位数=表的总记录数

3、 所需的位图个数=索引列的不同键值多少,列的不同值越少,所需的位图就越少

4、 当根据键值查询时,可以根据起始Rowid和位图状态,快速定位数据.

5、 这样与B*树那样直接保存rowid的区别就在于每次都要进行rowid的换算工作。

三、例子

以EMP表为例

create table EMP

(

EMPNO NUMBER(4) PRIMARY KEY,

ENAME VARCHAR2(10),

JOB VARCHAR2(9),

MGR NUMBER(4),

HIREDATE DATE,

SAL NUMBER(7,2),

COMM NUMBER(7,2),

DEPNO NUMBER(4)

);

插入数据

INSERT INTO EMP VALUES (7369,‘SMITH‘,‘CLERK‘,7902,to_date(‘17-12-1980‘,‘dd-mm-yyyy‘),800,null,20);

INSERT INTO EMP VALUES (7499,‘ALLEN‘,‘SALESMAN‘,7698,to_date(‘20-2-1981‘,‘dd-mm-yyyy‘),1600,300,30);

INSERT INTO EMP VALUES (7521,‘WARD‘,‘SALESMAN‘,7698,to_date(‘22-2-1981‘,‘dd-mm-yyyy‘),1250,500,30);

INSERT INTO EMP VALUES (7566,‘JONES‘,‘MANAGER‘,7839,to_date(‘2-4-1981‘,‘dd-mm-yyyy‘),2975,NULL,20);

INSERT INTO EMP VALUES (7654,‘MARTIN‘,‘SALESMAN‘,7698,to_date(‘28-9-1981‘,‘dd-mm-yyyy‘),1250,1400,30);

INSERT INTO EMP VALUES (7698,‘BLAKE‘,‘MANAGER‘,7839,to_date(‘1-5-1981‘,‘dd-mm-yyyy‘),2850,NULL,30);

INSERT INTO EMP VALUES (7782,‘CLARK‘,‘MANAGER‘,7839,to_date(‘9-6-1981‘,‘dd-mm-yyyy‘),2450,NULL,10);

INSERT INTO EMP VALUES (7839,‘KING‘,‘PRESIDENT‘,NULL,to_date(‘17-11-1981‘,‘dd-mm-yyyy‘),5000,NULL,10);

INSERT INTO EMP VALUES (7844,‘TURNER‘,‘SALESMAN‘,7698,to_date(‘8-9-1981‘,‘dd-mm-yyyy‘),1500,0,30);

INSERT INTO EMP VALUES (7900,‘JAMES‘,‘CLERK‘,7698,to_date(‘3-12-1981‘,‘dd-mm-yyyy‘),950,NULL,30);

INSERT INTO EMP VALUES (7902,‘FORD‘,‘ANALYST‘,7566,to_date(‘3-12-1981‘,‘dd-mm-yyyy‘),3000,NULL,20);

INSERT INTO EMP VALUES (7934,‘MILLER‘,‘CLERK‘,7782,to_date(‘23-1-1982‘,‘dd-mm-yyyy‘),1300,NULL,10);

select distinct "JOB" from emp

创建位图索引

create bitmap index emp_job_bitmap_idx on emp(job);

查询

SELECT EMPNO,ENAME,SAL FROM EMP WHERE JOB = ‘SALESMAN‘;

上述查询语句的目的是在EMP表中查询工作岗位是SALESMAN的员工的员工号,姓名和薪水,此时假设已经在EMP表的JOB列建立了位图索引,其结构如下图所示。

在该索引图中,共用5 类JOB,每类JOB 对应14 个比特位(对应14 行记录),其中某行的在该列的值与JOB 值对应则使用比特1 表示,如JOB = ‘CLERK’,第一行在该列对应的值是CLERK,就用比特1表示。否则用比特0表示,其他JOB类类似。

SELECT EMPNO,ENAME,SAL FROM EMP WHERE JOB = ‘SALESMAN‘

通过位图索引扫描JOB=‘CLERK’对应的位图记录,找到值为1 的行记录,即找到需要查找数据。

(验证了每次都要进行rowid的换算工作)

四、位图索引与数据DML锁定

4.1 Bitmap测试

用实验说明为什么位图索引不适合OLTP,比较适合OLAP。即:DML操作比较多的表不适合使用位图索引。

以上面的EMP表为例,我们已经在该表的JOB字段建立了位图索引

Session1:

select distinct sid from v$mystat;

UPDATE EMP SET JOB=‘CLERK‘ WHERE ENAME=‘ALLEN‘;

Session2

select distinct sid from v$mystat;

UPDATE EMP SET JOB=‘SALESMAN‘ WHERE ENAME=‘SMITH‘;

select * from v$lock where sid in(10,128) order by type;
select sid,status,last_call_et,blocking_session from v$session where sid in(10,128);

可以看见10阻塞了128 。尽管他们修改的不是同一列。

Session1提交

Session2 阻塞解除,自动执行了

4.2 B树索引测试。

如果使用B树索引,就不存在阻塞情况了。创建同样的EMP表,使用EMPNO字段,英爱该字段为primary key,为B树索引。

Session1

SQL> select distinct sid from v$mystat;

SID

----------

10

SQL> UPDATE EMP SET EMPNO=8000 WHERE ENAME=‘ALLEN‘;

1 row updated.

SQL>

Session2

SQL> select distinct sid from v$mystat;

SID

----------

421

SQL> UPDATE EMP SET EMPNO=9000 WHERE ENAME=‘SMITH‘;

1 row updated.

SQL>

select sid,status,last_call_et,blocking_session from v$session where sid in(10,421);

两个窗口均为INACTIVE

五、位图索引的特点

5.1 Bitmap索引的存储空间更小

相对于B*Tree索引,位图索引由于只存储键值的起止Rowid和位图,占用的空间非常少. bitmap的空间占用主要与以下因素相关:

       a.表的总记录数

       b.索引列的键值多少,列的不同值越少,所需的位图就越少.

5.2 Bitmap索引创建的速度更快

位图索引创建时不需要排序, B*Tree索引则在创建时需要排序,定位等操作,速度要慢得多.

5.3 Bitmap索引允许键值为空

Bitmap索引允许键值为空 B*Tree索引由于不记录空值,当基于is null的查询时,会使用全表扫描, 而对位图索引列进行is null查询时,则可以使用索引.

5.4 Bitmap索引对表记录的高效访问

当使用count(XX),可以直接访问索引就快速得出统计数据.

当根据位图索引的列进行and,or或 in(x,y,..)查询时,直接用索引的位图进行或运算,在访问数据之前可事先过滤数据.

5.5 Bitmap索引对批量DML操作只需进行一次索引

由于通过位图反映数据情况,批量操作时对索引的更新速度比B*Tree索引一行一行的处理快得多.

5.6 Bitmap索引的锁机制

对于B*Tree索引,insert操作不会锁定其它会话的DML操作. 而位图索引,由于用位图反映数据,不同会话更新相同键值的同一位图段,insert、update、delete相互操作都会发锁定。

原文

位图索引(Bitmap Index)——索引共用

B树索引和位图索引的区别!

时间: 2024-08-04 05:36:24

位图索引的相关文章

【Bitmap Index】B-Tree索引与Bitmap位图索引的锁代价比较研究

通过以下实验,来验证Bitmap位图索引较之普通的B-Tree索引锁的“高昂代价”.位图索引会带来“位图段级锁”,实际使用过程一定要充分了解不同索引带来的锁代价情况. 1.为比较区别,创建两种索引类型的测试表1)在表t_bitmap上创建位图索引[email protected]> create table t_bitmap (id number(10), name varchar2(10),sex varchar2(1)); Table created. [email protected]>

Oracle索引总结(四)- Oracle索引种类之位图索引

位图索引 1.1 位图索引概述 位图索引通过位图向量,表示索引键值在表中的分布. 适用于没有大量更新操作的对象,如:OLAP数据库. 对于存在大量更新操作的索引列,不适用位图索引.因此对于OLTP并不适用. 更新位图向量时,相应位图涉及的所有数据行会被锁定,无法针对这些数据行的该索引列进行DML操作. 1.2 位图索引结构的说明 与B-tree索引的联系及区别如下: 与B-tree索引的联系:位图索引使用B-tree形式组成. 与B-tree索引的区别:位图索引的一个索引键值对应一个叶子节点.(

B树索引和位图索引的区别!

B树索引主键和唯一性约束字段的B树索引,效率几乎和海量数据没有关系. 键值重复率低的字段比较适合使用B树索引. 位图索引键值重复率高的字段比较适合使用位图索引.count.and.or.in这些特定的操作更适合位图索引. DML操作比较多的表不适合使用位图索引. 复合索引在where条件中必须带驱动列,复合索引才会使用. 键值重复率低(DISTINCT数量多)的字段放在前面. 用实验说明为什么位图索引不适合OLTP,比较适合OLAP.即:DML操作比较多的表不适合使用位图索引. 首先创建测试表:

索引:位图索引理解

文章转载自  http://www.360doc.com/content/14/0508/15/11965070_375805586.shtml 1. 案例 有张表名为table的表,由三列组成,分别是姓名.性别和婚姻状况,其中性别只有男和女两项,婚姻状况由已婚.未婚.离婚这三项,该表共有100w个记录.现在有这样的查询:     select * from table where Gender='男' and Marital="未婚"; 姓名(Name) 性别(Gender) 婚姻状

索引——位图索引

位图索引非常适合于决策支持系统(Decision Support System,DSS)和数据仓库,它们不应该用于通过事务处理应用程序访问的表.它们可以使用较少到中等基数(不同值的数量)的列访问非常大的表.尽管位图索引最多可达30个列,但通常它们都只用于少量的列. 例如,您的表可能包含一个称为Sex的列,它有两个可能值:男和女.这个基数只为2,如果用户频繁地根据Sex列的值查询该表,这就是位图索引的基列.当一个表内包含了多个位图索引时,您可以体会到位图索引的真正威力.如果有多个可用的位图索引,O

hbase中的位图索引--布隆过滤器

在hbase中,读业务是非常频繁的.很多操作都是客户端根据meta表定位到具体的regionserver然后再查询region中的具体的数据. 但是现在问题来了,一个region由一个memstore以及多个filestore组成,memstore类似缓存在服务器内存中,可以提高插入的效率,当memstore达到一定大小(由hbase.hregion.memstore.flush.size设置)或者说用户手动flush之后,就会固化存储在hdfs之类的磁盘系统上.也就是说一个region可以对应

Atitit 索引技术--位图索引

索引在数据结构上可以分为三种B树索引.位图索引和散列索引 存储原理 编辑 位图索引对数据表的列的每一个键值分别存储为一个位图,Oracle对于不同的版本,不同的操作方式,数据生成均有差别. 对于8i,9i, 下面分3种方式来讨论数据的插入: a.一次插入一行,插入多行后,一次提交; b.每插入一行,提交一次; c.批量插入方式,一次提交; 对于第一种方式,观察位图索引的变化情况. a.假设插入8行相同键值的数据,如果以每行方式插入,然后一次提交,则会生成8个位图 SQL> Insert Into

oracle位图索引

以下内容主要都是关于oracle 10g位图索引,重点是存储,其它优缺点,查询机制等也略微介绍,概因为存储机制是根基.内容主要分四个部分:1)来源于http://blog.chinaunix.net/uid-20687159-id-1894992.html2)来源于http://blog.sina.com.cn/s/blog_4c6fef63010085m8.html3)来自oracle官方文档的和其它一些.  4)个人的试验,看位图索引的情况.-------------------------

于位图索引相关的执行计划

位图索引是oracle数据库里除B树索引之外的另外一种索引的类型,它主要用于数据仓库或者DSS系统.在数据仓库或DSS系统中,针对某些类型的sql,用位图索引比用B树索引要快很多,这主要是位图索引实现了快捷的按位运算的缘故. 位图索引的物理存储结构和普通B树索引的物理存储结构相似,也是按照被索引的键值列有序存储,只不过和索引键值一起存储的不再仅仅是索引键值所对应的rowid,而是变成了三部分的组合.这三部分分别为对应rowid的下限,对应rowid的上限和被压缩存储的位图(Bitmap Segm