索引方式:唯一索引,主键索引,多属性索引,部分索引,表达式索引.
索引类型:B-Tree,Hash,GiST,GIN以及表达式索引
PostgreSQL所有索引都是“从属索引”,也就是说,索引在物理上与它描述的表文件分离。
索引也是对象,在表pg_class里有记录。
索引的内部结构与索引的访问方法(索引类型)相关。所有访问方法都通过页面来组织索引的内部结构,这样可以使用存储管理器提供的接口来访问索引。
索引方式
多属性索引:如果一个索引定义多一个一个属性,就称为多属性索引,用于组合查询。
PostgreSQL中的B-Tree,GiST,GIN都支持多属性索引。最多支持32个属性。
不仅可以用表中的属性,而且还可以用函数或者表达式计算得到的值作为属性索引。
部分索引:建立在表上的子集的一个索引,该子集有一个表达式定义(表达式就是部分索引谓词)。
CREATE INDEX STU_NAME_INX ON STUDENT(NAME) WHERE (ID > 10 AND ID <20);
使用部分索引,能够减小索引规模,提高索引查询效率。
表达式索引:可以建立在函数或者从表中一个或者多个属性计算出来的标量表达式上。
CREATE INDEX STU_LOW_NAME_IDX ON STUDENT(LOWER(NAME));
表达式索引,只有在查询是使用与创建时相同的表达式才有作用。
部分索引谓词跟表达式索引的表达式都会存储在pg_index表indexprs属性中。
在创建索引的时候,会根据表达式计算出实际索引值的范围,这会导致插入跟新速度变慢。
索引类型
B-Tree:一种类似于B+数的数据结构来存储数据的键值。
支持比较查询跟范围查询(>,=,<)。
Hash:Hash索引会使用hash函数对索引关键字进行散列,Hash只能处理=操作。
GiST:通用搜索树,这个需要单独来学习。
GIN:倒排索引,可以处理包含多个键的值(例如数组)。跟GiST类似。
索引相关系统表
pg_am:
postgres=# select count(*) from pg_am; count ------- 5 (1 row)
分别为:btree,hash,gist,gin,spgist。
如果是做数据库二次开发的,可以关注后面13个字段,是提供13个模块的接口函数。
pg_index:
创建个索引,会再pg_class创建个添加一条记录,也会再pg_index添加一条。
pg_index用于记录索引的相关信息。
几个重要字段说明:
indexrelid 该索引在pg_class里的OID。
indrelid 表示索引依赖的的基表的OID。
indisvalid 为真,那么可用于查询,否则表示该索引不完善,需要在INSERT/UPDATE操作时更新。
indkey 这为一个数组,记录这个索引在基表那些字段上面建立了索引,如果数组里有值为0,那么索引属性在表属性上是一个表达式。
indexprs 索引的表达式
pg_opclass:
每一个索引类型并不直接设定该类型的索引所要操作的数据类型。该表表明了索引索引方法在操作特定数据
类型的时候,需要使用的的操作集合。
还有几个系统视图,都是对索引操作类型的说明
pg_opfamily:
pg_amop:
pg_amproc: