【原创】MySQL5.7 虚拟列实现表达式索引

MySQL自古以来就不提供函数索引这么复杂的功能。那怎么在MySQL里面实现这样的功能呢? 我们先来看看函数索引的概念。函数索引,也可称为表达式索引,也就是基于字段以特定函数(表达式)建立索引来提升查询性能之需。函数索引的优势在于更加精确的获取所需要的数据。

MySQL 5.7提供了一个新的特性,虚拟列,可以很完美的解决这个问题。

在介绍虚拟列之前,我们来看看在MySQL里面普通索引的范例。

示例表结构:

CREATE TABLE t1 (id INT ,rank INT, log_time DATETIME, nickname VARCHAR(64)) ENGINE INNODB;
ALTER TABLE t1 ADD PRIMARY KEY (id), ADD KEY idx_rank (rank),ADD KEY idx_log_time (log_time);

示例表数据量,这里我增加了5000条记录:

mysql> select count(*) from t1;
+----------+
| count(*) |
+----------+
|     5000 |
+----------+
1 row in set (0.00 sec)

假设我们来检索2015年4月9号的数据。(结果是有两条记录,id 分别为95和3423。)

mysql> SELECT * FROM t1 WHERE DATE(log_time) = ‘2015-04-09‘\G
*************************** 1. row ***************************
      id: 95
    rank: 24
log_time: 2015-04-09 05:53:13
nickname: test
*************************** 2. row ***************************
      id: 3423
    rank: 42
log_time: 2015-04-09 02:55:38
nickname: test
2 rows in set (0.01 sec)

下来我们看看这条语句的查询计划。

mysql> explain SELECT * FROM t1 WHERE DATE(log_time) = ‘2015-04-09‘\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t1
   partitions: NULL
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 5000
     filtered: 100.00
        Extra: Using where
1 row in set, 1 warning (0.00 sec)

我们发现TYPE是ALL,扫描的函数是5000,也就是说这条语句进行了一个全表扫描。 虽然给字段log_time 加了索引,但是没有用到,那这个时候怎么办?

在MySQL里面一般这样修改:

mysql> SELECT * FROM t1 WHERE log_time >= ‘2015-04-09 00:00:00‘ AND log_time <=‘2015-04-10 00:00:00‘\G
*************************** 1. row ***************************
      id: 3423
    rank: 42
log_time: 2015-04-09 02:55:38
nickname: test
*************************** 2. row ***************************
      id: 95
    rank: 24
log_time: 2015-04-09 05:53:13
nickname: test
2 rows in set (0.00 sec)

通过查询结果,发现结果集一致,那再来看看查询计划

mysql> explain SELECT * FROM t1 WHERE log_time >= ‘2015-04-09 00:00:00‘ AND log_time <= ‘2015-04-10 00:00:00‘\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t1
   partitions: NULL
         type: range
possible_keys: idx_log_time
          key: idx_log_time
      key_len: 6
          ref: NULL
         rows: 2
     filtered: 100.00
        Extra: Using index condition
1 row in set, 1 warning (0.00 sec)

可以看到这条修改过的语句很好的利用到了idx_log_time这条索引。

那好,这个是之前在MySQL 5.6以及之前的旧版本解决方法,随着MySQL 5.7的发布,虚拟列的出现让这个问题更加简单。

现在修改下之前的表结构:

ALTER TABLE t1 ADD COLUMN log_date  DATE AS (DATE(log_Time)) stored, ADD KEY idx_log_date (log_date);

这样,增加了一新列,用来存放date(log_time)这个表达式,并且给他加了一列索引。

那么,之前的语句就变成如下:

mysql> SELECT * FROM t1 WHERE log_date = ‘2015-04-09‘\G
*************************** 1. row ***************************
      id: 95
    rank: 24
log_time: 2015-04-09 05:53:13
nickname: test
log_date: 2015-04-09
*************************** 2. row ***************************
      id: 3423
    rank: 42
log_time: 2015-04-09 02:55:38
nickname: test
log_date: 2015-04-09
2 rows in set (0.00 sec)

执行后结果集和之前的一致。

我们来看看查询计划,发现很好的利用了idx_log_date索引列。

mysql> explain  SELECT * FROM t1 WHERE log_date = ‘2015-04-09‘\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: t1
   partitions: NULL
         type: ref
possible_keys: idx_log_date
          key: idx_log_date
      key_len: 4
          ref: const
         rows: 2
     filtered: 100.00
        Extra: NULL
1 row in set, 1 warning (0.00 sec)

通过以上介绍,我们看到虚拟列实现起来相对之前的方法来的容易的多。但是这里笔者还是得说上几句。

函数索引的用法以及SQL语句虽然写起来简单,但是在大部分场合下,只能说不得已而为之,是一种设计上的缺陷,后期增加了运维人员的运维难度以及繁琐度。这也就是为什么MySQL 直到5.7才推出了这项类似的功能的原因。

时间: 2024-10-29 04:05:58

【原创】MySQL5.7 虚拟列实现表达式索引的相关文章

MySQL5.7 虚拟列实现表达式索引

MySQL自古以来就不提供函数索引这么复杂的功能.那怎么在MySQL里面实现这样的功能呢? 我们先来看看函数索引的概念.函数索引,也可称为表达式索引,也就是基于字段以特定函数(表达式)建立索引来提升查询性能之需.函数索引的优势在于更加精确的获取所需要的数据. MySQL 5.7提供了一个新的特性,虚拟列,可以很完美的解决这个问题.在介绍虚拟列之前,我们来看看在MySQL里面普通索引的范例.示例表结构: CREATE TABLE t1 (id INT ,rank INT, log_time DAT

mysql5.7虚拟列初次尝试

添加虚拟列 ALTER TABLE erp_new_source_reports add client_name VARCHAR(80) generated always as (clients->"$.name"); ALTER TABLE erp_new_source_reports add client_type VARCHAR(20) generated always as (clients->"$.type"); ALTER TABLE erp

虚拟列分区

Oracle11g 增加了虚拟列的新特性,具体说明如下: 1.只能在堆组织表(普通表)上创建虚拟列,不能在索引组织表.外部表.临时表上创建虚拟列: 2.虚拟列不能是LOB或者RAW类型: 3.虚拟列的值并不是真实存在的,只有用到时,才根据表达式计算出虚拟列的值,磁盘上并不存放.虚拟列的值由ORACLE根据表达式自动计算得出,不可以手动去修改和指定虚拟列的值. 4.可把虚拟列当做分区关键字建立分区表,这是ORACLE 11g的另一新特性--虚拟列分区 创建带有虚拟列的分区表:    create

Oracle 11g 虚拟列 Virtual Column介绍

Oracle 11G 虚拟列 Virtual Column Oracle 11G 在表中引入了虚拟列,虚拟列是一个表达式,在运行时计算,不存储在数据库中,不能更新虚拟列的值. 定义一个虚拟列的语法: column_name [datatype] [GENERATED ALWAYS] AS [expression] [VIRTUAL] 1.虚拟列可以用在select,update,delete语句的where条件中,但是不能用于DML语句 2.可以基于虚拟列来做分区 3. 可以在虚拟列上建索引,o

Oracle 11g 新特性(一)-- 虚拟列

数据库版本: Oracle Database 11g Enterprise Edition Release 11.2.0.2.0 - 64bit Oracle11g 增加了虚拟列的新特性, 具体说明如下: 1> 只能在堆组织表(普通表)上创建虚拟列,不能在索引组织表.外部表.临时表上创建虚拟列 2> 虚拟列不能是LOB或者RAW类型 3> 虚拟列的值并不是真实存在的,只有用到时,才根据表达式计算出虚拟列的值,磁盘上并不存放 4> 可把虚拟列当做分区关键字建立分区表,这是ORACLE

Oracle 11g新特性之--虚拟列(Virtual Column)

Oracle 11g新特性之--虚拟列(Virtual Column) Oracle 11G虚拟列Virtual Column介绍 Oracle 11G 在表中引入了虚拟列,虚拟列是一个表达式,在运行时计算,不存储在数据库中,不能更新虚拟列的值. 定义一个虚拟列的语法: column_name [datatype] [GENERATED ALWAYS] AS [expression] [VIRTUAL] 1.虚拟列可以用在select,update,delete语句的where条件中,但是不能用

数据的虚拟列-让数据库中的C字段等于a+b

直接用update aaaaa aa set aa.f = (aa.a+aa.b)就行了 ======================================= 引出来的新知识--虚拟列 虚拟列的好处是:如果c=a+b那插入数据时:值只插入a=1,b=2;那么c会自动是3 oracle temporary table and virtual column (2013-07-31 15:06:55) 转载▼ 标签: oracle 学习 临时表 虚拟列 分类: Oracle基础学习 表是数据

MySQL 5.7 虚拟列 (virtual columns)

参考资料: Generated Columns in MySQL 5.7.5 MySQL 5.7新特性之Generated Column(函数索引) MySQL 5.7原生JSON格式支持 Generated Column 在MySQL 5.7中,支持两种Generated Column,即Virtual Generated Column和Stored Generated Column,前者只将Generated Column保存在数据字典中(表的元数据),并不会将这一列数据持久化到磁盘上:后者

在计算列中创建索引提高性能

前言:在理解计算列上的索引之前,先了解计算列的基本知识.计算列由可以使用同一表中的其他列的表达式计算得来.表达式可以是非计算列的列名.常量.函数,也可以是用一个或多个运算符连接的上述元素的任意组合.表达式不能为子查询.默认情况下,计算列是一个虚拟的列,并且可以在调用时重新计算,直到在CREATE TABLE或者ALTER TABLE 命令中使用PERSISTED.如果列定义成PERSISTED,会存放计算值,并存放在原始列上更新后的汇总值,不能对计算列进行INSERT.UPDATE. 准备工作: