mysql Partition(分区)初探

mysql Partition(分区)初探

表数据量大的时候一般都考虑水平拆分,即所谓的sharding.不过mysql本身具有分区功能,可以实现一定程度 的水平切分.

mysql是具有MERGE这种引擎的,就是把一些结构相同的MyIASM表作为一个表使用,但是我觉得 MERGE不如partition实用,

www.2cto.com

因为MERGE会在所有的底层表上查询,而partition只在相应的分区上查询.

建立了两个表,分别为分区和未分区的,分区表按年进行分区.

Sql代码

CREATE TABLE `20130117date_par` (

`content` varchar(20) NOT NULL,

`create_time` datetime NOT NULL,

KEY `20130117date_idx_date` (`create_time`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8

PARTITION BY RANGE (YEAR(create_time))

(PARTITION p2009 VALUES LESS THAN (2010),

PARTITION p2010 VALUES LESS THAN (2011),

PARTITION p2011 VALUES LESS THAN (2012),

PARTITION p2012 VALUES LESS THAN (2013),

PARTITION p2013 VALUES LESS THAN (2014))

CREATE TABLE `20130117date` (

`content` varchar(20) NOT NULL,

`create_time` datetime NOT NULL,

KEY `20130117date_idx_date` (`create_time`)

) ENGINE=InnoDB

用sp向分区表和普通表各插入了90w条随机数据.

用mysqlslap进行下测试

不用分区表

Sql代码

select SQL_NO_CACHE * from 20130117date

where create_time BETWEEN ‘2013-01-01‘ and ‘2013-01-02‘;

select SQL_NO_CACHE * from 20130117date

where create_time BETWEEN ‘2012-12-25‘ and ‘2013-01-05‘;

引用

Benchmark

Average number of seconds to run all queries: 0.881 seconds

Minimum number of seconds to run all queries: 0.062 seconds

Maximum number of seconds to run all queries: 3.844 seconds

Number of clients running queries: 1

Average number of queries per client: 2

Benchmark

Average number of seconds to run all queries: 0.703 seconds

Minimum number of seconds to run all queries: 0.062 seconds

Maximum number of seconds to run all queries: 1.922 seconds

Number of clients running queries: 1

Average number of queries per client: 2

Benchmark

Average number of seconds to run all queries: 1.250 seconds

Minimum number of seconds to run all queries: 0.109 seconds

Maximum number of seconds to run all queries: 4.032 seconds

Number of clients running queries: 1

Average number of queries per client: 2

用分区表

Sql代码

select SQL_NO_CACHE * from 20130117date_par

where create_time BETWEEN ‘2013-01-01‘ and ‘2013-01-02‘;

select SQL_NO_CACHE * from 20130117date_par

where create_time BETWEEN ‘2012-12-25‘ and ‘2013-01-05‘;

引用

Benchmark

Average number of seconds to run all queries: 0.068 seconds

Minimum number of seconds to run all queries: 0.047 seconds

Maximum number of seconds to run all queries: 0.110 seconds

Number of clients running queries: 1

Average number of queries per client: 2

Benchmark

Average number of seconds to run all queries: 0.250 seconds

Minimum number of seconds to run all queries: 0.031 seconds

Maximum number of seconds to run all queries: 1.078 seconds

Number of clients running queries: 1

Average number of queries per client: 2

Benchmark

Average number of seconds to run all queries: 0.046 seconds

Minimum number of seconds to run all queries: 0.046 seconds

Maximum number of seconds to run all queries: 0.047 seconds

Number of clients running queries: 1

Average number of queries per client: 2

www.2cto.com

看来性能还是有一定的提升的.

执行

Sql代码

explain PARTITIONS select * from 20130117date_par

where create_time BETWEEN ‘2012-01-01‘ and ‘2012-01-02‘;

可以看出这个query只扫描了p2012这个分区.

而且分区表的好处在于维护比较方便.比如2009年的数据不需要了,分区表的方法为

Sql代码

alter table 20130117date_par drop PARTITION p2009

不到1s就行了

普通表为

Sql代码

delete from 20130117date

where create_time BETWEEN ‘2009-01-01‘ and ‘2010-01-01‘

用了10.25s左右

时间: 2024-10-05 06:17:06

mysql Partition(分区)初探的相关文章

MySQL partition分区I

http://blog.csdn.net/binger819623/article/details/5280267 一.        分区的概念二.        为什么使用分区?(优点)三.        分区类型四.        子分区五.        对分区进行修改(增加.删除.分解.合并)六.        不同引擎的分区特性七.        分区的限制性 分区概念分区针对不同的数据库,具有不同的特性.在这里专门针对MySQL数据库而言.在MySQL数据库里,分区这个概念是从my

Mysql Partition分区(理论)

Partition  分区 拿来主义,MySql 5.6 手册:http://dev.mysql.com/doc/refman/5.6/en/partitioning.html 分区类型 MySql 支持Range,List,Hash,Key.最长用的是Range Range:范围 CREATE TABLE employees (     id INT NOT NULL,     fname VARCHAR(30),     lname VARCHAR(30),     hired DATE N

mysql partition分区

(转) 自5.1开始对分区(Partition)有支持 = 水平分区(根据列属性按行分)=举个简单例子:一个包含十年发票记录的表可以被分区为十个不同的分区,每个分区包含的是其中一年的记录. === 水平分区的几种模式:===* Range(范围) – 这种模式允许DBA将数据划分不同范围.例如DBA可以将一个表通过年份划分成三个分区,80年代(1980's)的数据,90年代(1990's)的数据以及任何在2000年(包括2000年)后的数据. * Hash(哈希) – 这中模式允许DBA通过对表

mysql的partition分区

前言:当一个表里面存储的数据特别多的时候,比如单个.myd数据都已经达到10G了的话,必然导致读取的效率很低,这个时候我们可以采用把数据分到几张表里面来解决问题.方式一:通过业务逻辑根据数据的大小通过id%10这种来分成 user1,user2,user3等这样的,但是这样会有很多问题我们需要维护这样一个hash关系, 而且每次读取数据和写入数据的时候还要去判断取那张表,这个是我们通过程序去识别写表和读表的.方式二:mysql可以通过partition进行分区,这种分区显示给我们的数据依然都是在

Mysql5.7—mysql优化分区、分表(必备)

小生博客:http://xsboke.blog.51cto.com 小生 Q Q:1770058260 -------谢谢您的参考,如有疑问,欢迎交流 一. 分表 1. 分表简介 分表是将一个大表按照一定的规则分解成多张具有独立存储空间的实体表. 如果正在使用的表需要进行分区,就需要同时修改app的规则,使mysql可以得知用户查询的数据在哪. 2. 分表类型 分为垂直切分和水平切分 垂直切分:将某些列分到另一个表 水平切分:将某些行分到另一个表 3. 分表的方式 1) Mysql集群 它并不是

mysql数据库分区功能及实例详解

分区听起来怎么感觉是硬盘呀,对没错除了硬盘可以分区数据库现在也支持分区了,分区可以解决大数据量的处理问题,下面一起来看一个mysql数据库分区功能及实例详解 一,什么是数据库分区 前段时间写过一篇关于mysql分表的的文章,下面来说一下什么是数据库分区,以mysql为例.mysql数据库中的数据是以文件的形势存在磁盘上的,默认放在/mysql/data下面(可以通过my.cnf中的datadir来查看),一张表主要对应着三个文件,一个是frm存放表结构的,一个是myd存放表数据的,一个是myi存

mysql表分区、查看分区

原文地址:http://blog.csdn.net/feihong247/article/details/7885199 一.       mysql分区简介 数据库分区 数据库分区是一种物理数据库设计技术.虽然分区技术可以实现很多效果,但其主要目的是为了在特定的SQL操作中减少数据读写的总量以缩减sql语句的响应时间,同时对于应用来说分区完全是透明的. MYSQL的分区主要有两种形式:水平分区和垂直分区 水平分区(HorizontalPartitioning) 这种形式的分区是对根据表的行进行

mysql的分区和分表

分区 分区就是把一个数据表的文件和索引分散存储在不同的物理文件中. mysql支持的分区类型包括Range.List.Hash.Key,其中Range比较常用: RANGE分区:基于属于一个给定连续区间的列值,把多行分配给分区. LIST分区:类似于按RANGE分区,区别在于LIST分区是基于列值匹配一个离散值集合中的某个值来进行选择. HASH分区:基于用户定义的表达式的返回值来进行选择的分区,该表达式使用将要插入到表中的这些行的列值进行计算.这个函数可以包含MySQL 中有效的.产生非负整数

mysql 表分区技术

表分区,是指根据一定规则,将数据库中的一张表分解成多个更小的,容易管理的部分.从逻辑上看,只有一张表,但是底层却是由多个物理分区组成. 表分区有什么好处: a.分区表的数据可以分布在不同的物理设备上,从而高效地利用多个硬件设备. b.和单个磁盘或者文件系统相比,可以存储更多数据 c.优化查询.在where语句中包含分区条件时,可以只扫描一个或多个分区表来提高查询效率:涉及sum和count语句时,也可以在多个分区上并行处理,最后汇总结果.d.分区表更容易维护.例如:想批量删除大量数据可以清除整个