【Mysql优化】聚簇索引与非聚簇索引概念

首先明白两句话:

　　innodb的次索引指向对主键的引用 (聚簇索引)

　　myisam的次索引和主索引都指向物理行 (非聚簇索引)

　　聚簇索引是对磁盘上实际数据重新组织以按指定的一个或多个列的值排序的算法。特点是存储数据的顺序和索引顺序一致。一般情况下主键会默认创建聚簇索引，且一张表只允许存在一个聚簇索引（理由：数据一旦存储，顺序只能有一种）。

在《数据库原理》一书中是这么解释聚簇索引和非聚簇索引的区别的：
　　聚簇索引的叶子节点就是数据节点，而非聚簇索引的叶子节点仍然是索引节点，只不过有指向对应数据块的指针。

INNODB和MYISAM的主键索引与二级索引的对比：

　　也就是InnoDB的主索引的节点与数据放在一起，次索引的节点存放的是主键的位置。

　　　　　　myisam的主索引和次索引都指向该数据在磁盘的位置。

InnoDB的的二级索引的叶子节点存放的是KEY字段加主键值。因此，通过二级索引查询首先查到是主键值，然后InnoDB再根据查到的主键值通过主键索引找到相应的数据块。而MyISAM的二级索引叶子节点存放的还是列值与行号的组合，叶子节点中保存的是数据的物理地址。所以可以看出MYISAM的主键索引和二级索引没有任何区别，主键索引仅仅只是一个叫做PRIMARY的唯一、非空的索引，且MYISAM引擎中可以不设主键

也可以用下面这幅图理解:

首先是myisam的索引主次索引都指向物理行:

InnoDB的主索引叶子节点是主键和数据，次索引指向主键

innodb的主索引文件上直接存放该行数据,称为聚簇索引,次索引指向对主键的引用

myisam中, 主索引和次索引,都指向物理行(磁盘位置).

注意: innodb来说,

　　1: 主键索引既存储索引值,又在叶子中存储行的数据

　　2: 如果没有主键, 则会Unique key做主键

　　3: 如果没有unique,则系统生成一个内部的rowid做主键.

　　4: 像innodb中,主键的索引结构中,既存储了主键值,又存储了行数据,这种结构称为”聚簇索引”

1、聚簇索引a) 一个索引项直接对应实际数据记录的存储页，可谓“直达”b) 主键缺省使用它c) 索引项的排序和数据行的存储排序完全一致，利用这一点，想修改数据的存储顺序，可以通过改变主键的方法（撤销原有主键，另找也能满足主键要求的一个字段或一组字段，重建主键）d) 一个表只能有一个聚簇索引（理由：数据一旦存储，顺序只能有一种）

2、非聚簇索引a) 不能“直达”，可能链式地访问多级页表后，才能定位到数据页b) 一个表可以有多个非聚簇索引

-------------------------------------聚簇索引优势劣势；-----------------------------------

　　优势: 根据主键查询条目比较少时,不用回行(数据就在主键节点下)

　　劣势: 如果碰到不规则数据插入时,造成频繁的页分裂.

聚簇索引的页分裂过程

理解:  原来索引如下

　　此时插入一个8，需要将13,16,17移动之后插入8

对于myisam引擎：只需要存储数据之后移动索引节点，对于innoDb的聚簇索引：插入数据之后需要移动13,16,17.但是因为这三个节点上面有数据，也就造成了额外的开销。相当于三个节点搬家的同时带着数据搬家。　　

也可以用下图理解:

总结:

　　1: innodb的buffer_page 很强大.

　　2: 聚簇索引的主键值,应尽量是连续增长的值,而不是要是随机值,

　　　　　　(不要用随机字符串或UUID)

　　　　否则会造成大量的页分裂与页移动.

　　为了看出效果可以用Java向数据库中按顺序插入1000条数据与乱序插入一千条数据。看执行的时间即可看出效果。

如下图:Innodb_pages_written代表已经写入的页数，可以按顺序插入1000条数据与乱序插入一千条数据观察增长的变化量。

mysql> show status like ‘%page_%‘;
+----------------------------------+-------+
| Variable_name                    | Value |
+----------------------------------+-------+
| Innodb_buffer_pool_pages_data    | 256   |
| Innodb_buffer_pool_pages_dirty   | 0     |
| Innodb_buffer_pool_pages_flushed | 749   |
| Innodb_buffer_pool_pages_free    | 243   |
| Innodb_buffer_pool_pages_misc    | 13    |
| Innodb_buffer_pool_pages_total   | 512   |
| Innodb_dblwr_pages_written       | 628   |
| Innodb_page_size                 | 16384 |
| Innodb_pages_created             | 67    |
| Innodb_pages_read                | 736   |
| Innodb_pages_written             | 749   |
| Tc_log_max_pages_used            | 0     |
| Tc_log_page_size                 | 0     |
| Tc_log_page_waits                | 0     |
+----------------------------------+-------+
14 rows in set (0.00 sec)

　　聚簇索引与非聚簇索引的区别参考:http://www.cnblogs.com/qlqwjy/p/7770580.html

原文地址：https://www.cnblogs.com/qlqwjy/p/8592684.html

时间： 2024-10-10 02:01:55

【Mysql优化】聚簇索引与非聚簇索引概念的相关文章

MySQL中Innodb的聚簇索引和非聚簇索引

聚簇索引数据库表的索引从数据存储方式上可以分为聚簇索引和非聚簇索引(又叫二级索引)两种.Innodb的聚簇索引在同一个B-Tree中保存了索引列和具体的数据,在聚簇索引中,实际的数据保存在叶子页中,中间的节点页保存指向下一层页面的指针.“聚簇”的意思是数据行被按照一定顺序一个个紧密地排列在一起存储.一个表只能有一个聚簇索引,因为在一个表中数据的存放方式只有一种. 一般来说,将通过主键作为聚簇索引的索引列,也就是通过主键聚集数据.下图展示了Innodb中聚簇索引的结构(图片来自<高性能MySQL

mysql索引总结(3)-MySQL聚簇索引和非聚簇索引

非聚簇索引索引节点的叶子页面就好比一片叶子.叶子头便是索引键值. 先创建一张表: CREATE TABLE `user` ( `id` INT NOT NULL , `name` VARCHAR NOT NULL , `class` VARCHAR NOT NULL); 对于MYISAM引擎,如果创建 id 和 name 为索引.对于下面查询: select * from user where id = 1 会利用索引,先在索引树中快速检索到 id,但是要想取到id对应行数据,必须找到改行数据

mysql索引总结(2)-MySQL聚簇索引和非聚簇索引

聚簇索引就是对磁盘上的实际数据重新组织以按照特定的一个或者多个列的值排序的算法特点是存储数据的顺序和索引顺序一致一般情况下主键会默认生成聚簇索引且一张表有且只有一个聚簇索引聚簇索引和非聚簇索引的区别是: 聚簇索引的叶子节点就是数据节点而非聚簇索引的叶子节点仍然是索引文件只是这个索引文件中包含指向对应数据块的指针 MySQL中不同的数据存储引擎对聚簇索引有不同的支持 MyISAM使用的是非聚簇索引原始数据存储方式按照列值和行号来组织索引的叶子节点中保存的实际上是指向存放数据块的

MySQL 聚簇索引和非聚簇索引的认识

聚簇索引是对磁盘上实际数据重新组织以按指定的一个或多个列的值排序的算法.特点是存储数据的顺序和索引顺序一致.一般情况下主键会默认创建聚簇索引,且一张表只允许存在一个聚簇索引. 在<数据库原理>一书中是这么解释聚簇索引和非聚簇索引的区别的:聚簇索引的叶子节点就是数据节点,而非聚簇索引的叶子节点仍然是索引节点,只不过有指向对应数据块的指针. 因此,MYSQL中不同的数据存储引擎对聚簇索引的支持不同就很好解释了.下面,我们可以看一下MYSQL中MYISAM和INNODB两种引擎的索引结构 myisa

MySQL聚簇索引和非聚簇索引的对比

首先要清楚:聚簇索引并不是一种单独的索引类型,而是一种存储数据的方式. 聚簇索引在实际中用的很多,Innodb就是聚簇索引,Myisam 是非聚簇索引. 在之前我想插入一段关于innodb和myisam的数据文件的对比: innodb一张表在硬盘上通过两个文件存储:tablename.frm,tablename.ibd,而myisam有三个文件:tablename.frm,tablename.myi,tablename.myd. frm是表结构文件,myi是索引文件,myd是数据文件,ibd是数

聚簇索引与非聚簇索引

索引是一种数据结构,用来快速访问数据库表格或者视图中的数据. 索引的目的是加快对表中数据记录的查找或排序. 索引的代价一是增加了数据库的存储空间,二是在插入和修改时要花费更多的时间. 索引有两中形式,聚簇索引和非聚簇索引聚簇索引也叫聚集索引,是一种对磁盘上数据重新组织以按指定的一个或多个列的值排列.每张表只能建一个聚簇索引,并且建聚簇索引需要至少相当该表120%的附加空间,以存放该表的副本和索引中间页. 非聚簇索引的索引顺序与数据物理顺序无关. 聚簇索引和非聚簇的区别: 1.聚簇索引的叶节点

聚簇索引和非聚簇索引的区别

一.聚簇索引和非聚簇索引 1.聚簇索引和非聚簇索引: 我拿查字典做一个比喻,字典的页面就好比是物理排列顺序,物理排列顺序是固定的,查询的方式就好比是索引,区别是聚簇索引就好比是拼音查询,每一个字母查询出来的页面顺序是跟你字母的顺序一致的,a字母查询出来的页面一定是在c字母查询出来的页面前面,而非聚簇索引就好比是笔画查询,笔画少的查出来的页面不一定在笔画多的查出来的页面前面,也就是你通过笔画查询的顺序和页面的顺序并不是一致的. 再举一例:聚簇索引的顺序就是数据的物理存储顺序,而对非聚簇索引的索引顺

通俗易懂索引、单列索引、复合索引、主键、唯一索引、聚簇索引、非聚簇索引、唯一聚簇索引的区别与联系

索引数据库只做两件事情:存储数据.检索数据.而索引是在你存储的数据之外,额外保存一些路标(一般是B+树),以减少检索数据的时间.所以索引是主数据衍生的附加结构. 一张表可以建立任意多个索引,每个索引可以是任意多个字段的组合.索引可能会提高查询速度(如果查询时使用了索引),但一定会减慢写入速度,因为每次写入时都需要更新索引,所以索引只应该加在经常需要搜索的列上,不要加在写多读少的列上. 单列索引与复合索引只包含一个字段的索引叫做单列索引,包含两个或以上字段的索引叫做复合索引(或组合索引).

数据库的聚簇索引和非聚簇索引

华为面试提到了数据库(索引)的数据结构,当时懵逼了,于是调查一下. 首先要讲一下索引的概念:所以其实是独立于数据而存储的:因为索引的用途是查询,所以存储的数据结构是B树(面试之后,我和面试官沟通了一下,数据库存储的数据结构是什么,结果被鄙视了):索引/ 数据的存储一般是以页为单位的: 那么为甚采用B树,而不是平衡二叉树之类的二叉树?因为B树可以有多个孩子,可以控制深度:二叉树则是一个节点只能有两个叶子(孩子)所以深度比较深,如果数据量很大,将会造成IO压力. 聚簇索引和非的本质差别在于叶子节点,