1 索引(index)
索引是一个单独的、物理的数据库结构,
它是某个表中一列或若干列值的集合和相应的指向表中物理标识这些值的数据页的逻辑指针清单
他的作用和字典的目录是一样的,就是为了加快查询的速度。
使用它来快速查找具有特定值的记录,
如果没有索引,执行查询时候必须从第一条记录开始扫描整个表的记录,直到符合要求的记录。
如果有了索引mysql无需扫描任何记录即可顺序找到目标记录的位置。
简单说来, 索引就是提高查找数据速度,数据量越多,效果越明显。
2 索引的好处与坏处
优点:
加快了查询速度(select ) 大大加快数据的检索速度;
创建唯一性索引,保证数据库表中每一行数据的唯一性;
加速表和表之间的连接;
在使用分组和排序子句进行数据检索时,可以显著减少查询中分组和排序的时间。
缺点:
降低了增,删,改的速度(update/delete/insert),当对表中的数据进行增加、删除和修改的时候,索引也要动态的维护,降低了数据的维护速度。
索引需要占物理空间 增大了表的文件大小(索引文件甚至可能比数据文件还大)
3 索引的分类
普通索引(index) :这是最基本的索引,它没有任何限制
唯一索引(unique):它与前面的普通索引类似,不同的就是:索引列的值必须唯一,但允许有一个空值NULL。
只要是UNiQUE 就是Unique索引.(只能在字段内容不重复的情况下,才能创建唯一索引)
主键索引(primary key)(通过主键约束间接创建):它是一种特殊的唯一索引,不允许有空值。一般是在建表的时候同时创建主键索引 在主键上自动创建
全文索引(fulltext) 只在MYISAM 存储引擎支持, 目的是全文索引,在内容系统中用的多, 在全英文网站用多(英文词独立).
中文数据不常用,意义不大 国内全文索引通常 使用 sphinx 来完成,全文索引只能在 char varchar text字段创建.
复合(组合)索引 :在表中的多个列上创建的索引。组合索引中列的顺序是任意的,可以是相邻的列,也可以是不相邻的列。 型如:create index 索引名 on 表名(列1,列2);
4 索引的使用
1)普通索引
这是最基本的索引类型,而且它没有唯一性之类的限制。
普通索引可以通过以下几种方式创建:
创建索引,例如CREATE INDEX <索引的名字> ON tablename (列的列表);
修改表,例如ALTER TABLE tablename ADD INDEX [索引的名字] (列的列表);
创建表的时候指定索引,例如CREATE TABLE tablename ( [...], INDEX [索引的名字] (列的列表) );
一般来说,普通索引的创建,是先创建表,然后在创建普通索引
比如:
create table ccc(
id int unsigned,
name varchar(32)
)
create index 索引名 on 表 (列1,列名2);
2)唯一性索引
这种索引和前面的“普通索引”基本相同,但有一个区别:索引列的所有值都只能出现一次,即必须唯一。
唯一性索引可以用以下几种方式创建:
创建索引,例如CREATE UNIQUE INDEX <索引的名字> ON tablename (列的列表);
修改表,例如ALTER TABLE tablename ADD UNIQUE [索引的名字] (列的列表);
创建表的时候指定索引,例如CREATE TABLE tablename ( [...], UNIQUE [索引的名字] (列的列表) );
①当表的某列被指定为unique约束时,这列就是一个唯一索引
create table ddd(
id int primary key auto_increment ,
name varchar(32) unique
);
这时, name 列就是一个唯一索引.
unique字段可以为NULL,并可以有多NULL, 但是如果是具体内容,则不能重复.
主键字段,不能为NULL,也不能重复.
②在创建表后,再去创建唯一索引
create table eee(
id int primary key auto_increment,
name varchar(32)
);
create unique index 索引名 on 表名 (列表..);
3)主键
主键是一种唯一性索引,但它必须指定为“PRIMARY KEY”。
如果你曾经用过AUTO_INCREMENT类型的列,你可能已经熟悉主键之类的概念了。
主键一般在创建表的时候指定,例如“CREATE TABLE tablename ( [...], PRIMARY KEY (列的列表) ); ”。
但是,我们也可以通过修改表的方式加入主键,例如“ALTER TABLE tablename ADD PRIMARY KEY (列的列表); ”。
每个表只能有一个主键。
当一张表,把某个列设为主键的时候,则该列就是主键索引
create table aaa(
id int unsigned primary key auto_increment ,
name varchar(32) not null defaul ‘’
);
这是id 列就是主键索引.
如果你创建表时,没有指定主键索引,也可以在创建表后,在添加, 指令:
alter table 表名 add primary key (列名);
create table bbb (
id int ,
name varchar(32) not null default ‘’
);
alter table bbb add primary key (id);
4)全文索引
MySQL从3.23.23版开始支持全文索引和全文检索。
在MySQL中,全文索引的索引类型为FULLTEXT。
全文索引可以在VARCHAR或者TEXT类型的列上创建。
它可以通过CREATE TABLE命令创建,也可以通过ALTER TABLE或CREATE INDEX命令创建。
对于大规模的数据集,通过ALTER TABLE(或者CREATE INDEX)命令创建全文索引要比把记录插入带有全文索引的空表更快。
全文索引,主要是针对对文件,文本的检索, 比如文章, 全文索引针对MyISAM有用.
创建 :
CREATE TABLE articles (
id INT UNSIGNED AUTO_INCREMENT NOT NULL PRIMARY KEY,
title VARCHAR(200),
body TEXT,
FULLTEXT (title,body)
)engine=myisam charset utf8;
INSERT INTO articles (title,body) VALUES
(‘MySQL Tutorial‘,‘DBMS stands for DataBase ...‘),
(‘How To Use MySQL Well‘,‘After you went through a ...‘),
(‘Optimizing MySQL‘,‘In this tutorial we will show ...‘),
(‘1001 MySQL Tricks‘,‘1. Never run mysqld as root. 2. ...‘),
(‘MySQL vs. YourSQL‘,‘In the following database comparison ...‘),
(‘MySQL Security‘,‘When configured properly, MySQL ...‘);
如何使用全文索引:
错误用法:
select * from articles where body like ‘%mysql%’; 【不会使用到全文索引】
证明:
explain select * from articles where body like ‘%mysql%’
key:null 表明并未使用任何索引
正确的用法是:
select * from articles where match(title,body) against(‘database’); 【可以】
Explain select * from articles where match(title,body) against(‘database’)\G
key:title 表明使用了title索引 而title索引正是全文索引的一部分
? 说明:
- 在mysql中fulltext 索引只针对 myisam生效
- mysql自己提供的fulltext针对英文生效 -> sphinx (coreseek) 技术处理中文
- 使用方法是 match(字段名..) against(‘关键字’)
5) 多列索引
索引可以是单列索引,也可以是多列索引。下面我们通过具体的例子来说明这两种索引的区别。假设有这样一个people表:
1 CREATE TABLE people ( 2 3 peopleid SMALLINT NOT NULL AUTO_INCREMENT, 4 5 firstname CHAR(50) NOT NULL, 6 7 lastname CHAR(50) NOT NULL, 8 9 age SMALLINT NOT NULL, 10 11 townid SMALLINT NOT NULL, 12 13 PRIMARY KEY (peopleid) 14 15 );
下面是我们插入到这个people表的数据:
这个数据片段中有四个名字为“Mikes”的人(其中两个姓Sullivans,两个姓McConnells),有两个年龄为17岁的人,还有一个名字与众不同的Joe Smith。
这个表的主要用途是根据指定的用户姓、名以及年龄返回相应的peopleid。
例如,我们可能需要查找姓名为Mike Sullivan、年龄17岁用户的peopleid
(SQL命令为SELECT peopleid FROM people WHERE firstname=‘Mike‘ AND lastname=‘Sullivan‘ AND age=17;)。
由于我们不想让MySQL每次执行查询就去扫描整个表,这里需要考虑运用索引。
首先,我们可以考虑在单个列上创建索引,比如firstname、lastname或者age列。
如果我们创建firstname列的索引(ALTER TABLE people ADD INDEX firstname (firstname);),
MySQL将通过这个索引迅速把搜索范围限制到那些firstname=‘Mike‘的记录,然后再在这个“中间结果集”上进行其他条件的搜索:
它首先排除那些lastname不等于“Sullivan”的记录,然后排除那些age不等于17的记录。当记录满足所有搜索条件之后,MySQL就返回最终的搜索结果。
由于建立了firstname列的索引,与执行表的完全扫描相比,MySQL的效率提高了很多,
但我们要求MySQL扫描的记录数量仍旧远远超过了实际所需要的。
虽然我们可以删除firstname列上的索引,再创建lastname或者age列的索引,但总地看来,不论在哪个列上创建索引搜索效率仍旧相似。
为了提高搜索效率,我们需要考虑运用多列索引。如果为firstname、lastname和age这三个列创建一个多列索引,
MySQL只需一次检索就能够找出正确的结果!下面是创建这个多列索引的SQL命令:
ALTER TABLE people ADD INDEX fname_lname_age (firstname,lastname,age);
由于索引文件以B-树格式保存,MySQL能够立即转到合适的firstname,然后再转到合适的lastname,最后转到合适的age。
在没有扫描数据文件任何一个记录的情况下,MySQL就正确地找出了搜索的目标记录!
那么,如果在firstname、lastname、age这三个列上分别创建单列索引,效果是否和创建一个firstname、lastname、age的多列索引一样呢?
答案是否定的,两者完全不同。当我们执行查询的时候,MySQL只能使用一个索引。
如果你有三个单列的索引,MySQL会试图选择一个限制最严格的索引。
但是,即使是限制最严格的单列索引,它的限制能力也肯定远远低于firstname、lastname、age这三个列上的多列索引。