数据库分区分表

http://blog.163.com/[email protected]/blog/static/12257726201051735823602/

一、分区表、分区索引概念

    为了满足而非常大的数据库的管理，需要创建和使用分区表和分区索引，分区表允许将数据分成成为分区甚至子分区的更小的、更好管理的块。每个分区可以单独管理，可以不依赖其他分区而单独发挥作用，因此可以提供更有利于可用性和性能的结构。

    表或索引可以共享相同的逻辑属性，但是可以有不同的物理属性。例如所有分区/子分区可以共享相同的列和约束，但是可以有不同的表空间。

    最好可以将表或者索引的分区存储到不同的表空间，这样的好处是：
    ● 减少数据在多个分区中冲突的可能性
    ● 可以单独备份和恢复每个分区
    ● 控制分区与磁盘驱动器之间的映射(平衡I/O负载)
    ● 改善可管理性、可用性和性能

二、分区方法

    1、范围分区

    当列数据可以被划分为逻辑范围时(例如年度中的月份)，就可以使用范围分区。当数据在整个范围中能被均等地划分时性能最好。如果所划分的分区范围大小明显不同时，则需要考虑其他的分区方法了。

    创建范围分区时，需要指定分区列、表示分区边界，例如：

    CREATE TABLE sales
    ( invoice_no NUMBER,
    sale_year INT NOT NULL,
    sale_month INT NOT NULL,
    sale_day INT NOT NULL )
    PARTITION BY RANGE (sale_year, sale_month, sale_day)
    ( PARTITION sale_q1 VALUES LESS THAN (1999, 04, 01)
    TABLLESPACE tsa,
    PARTITION sale_q2 VALUES LESS THAN (1999, 07, 01)
    TABLLESPACE tsb,
    PARTITION sale_q3 VALUES LESS THAN (1999, 10, 01)
    TABLLESPACE tsc,
    PARTITION sale_q4 VALUES LESS THAN (2000, 01, 01)
    TABLLESPACE tsd );

    注：要注意使用不同字符集的数据库时，最字符的分类序列有时是不同的。

    2、散列分区

    当数据不太容易进行范围划分时，为了性能和管理的原因又想分区时，就可以使用散列分区方法。散列分区将在指定数量的分区中均等得划分数据。创建散列分区需要指定分区列、分区数量(或单独的分区描述)举例如下：

    CREATE TABLE scubagear
    (id NUMBER,
    name VARCHAR2(60))
    PARTITION BY HASH (id)
    PARTITIONS 4
    STORE IN (gear1, gear2, gear3, gear4);

    3、列表分区

    当需要明确地控制如何将行映射到分区时，就需要使用列表分区。可以在每个分区表述中为该分区指定一列离散值。

    列表分区与范围分区、散列分区的区别在于
    ● 范围分区为分列假设了一个值的自然范围，无法将该值范围之外的分区组织在一起
    ● 散列分区无法对数据的划分进行控制，在逻辑上是无须的

    需要注意的是：列表分区无法支持多列分区。具体举例如下：

    CREATE TABLE sales_by_region
    (deptno number,
    deptname varchar2(20),
    quarterly_sales number(10,2),
    state varchar2(2))
    PARTITION BY LIST (state)
    (PARTITION q1_northwest VALUES (‘OR‘, ‘WA‘),
    PARTITION q1_southwest VALUES (‘AZ‘, ‘UT‘, ‘NM‘),
    PARTITION q1_northeast VALUES (‘NY‘, ‘VM‘, ‘NJ‘),
    PARTITION q1_southeast VALUES (‘FL‘, ‘GA‘),
    PARTITION q1_northcentral VALUES (‘SD‘, ‘WI‘),
    PARTITION q1_southcentral VALUES (‘OK‘, ‘TX‘));

    4、组合分区

    组合分区是在分区中使用范围分区，而在子分区中使用散列分区。组合分区很适合于历史数据和条块数据两者，改善了范围分区及其数据放置的管理型。例如一下举例：

    CREATE TABLE scubaqear (equipno NUMBER, equipname VARCHAR(32), price NUMBER)
    PARTITION BY RANGE (equipno) SUBPARTITION BY HASH(equipname)
    SUBPARTITIONS 8 STORE IN (ts1, ts2, ts3, ts4)
    (PARTITION p1 VALUES LESS THAN (1000),
    PARTITION p2 VALUES LESS THAN (2000),
    PARTITION p3 VALUES LESS THAN (MAXVALUE));

三、分区表的创建

    1、创建范围分区表

    使用PARTITION BY RANGE子句来表明范围分区，使用PARTITION子句标识各个分区范围，另外PARTITION子句下级子句可以指定特别用于该分区段的物理属性，如果没有重载，则自动继承基础表的属性。

    重新修改上面的例子：

    CREATE TABLE sales
    ( invoice_no NUMBER,
    sale_year INT NOT NULL,
    sale_month INT NOT NULL,
    sale_day INT NOT NULL )
    STORAGE (INITIAL 100K NEXT 50K) LOGGING
    PARTITION BY RANGE (sale_year, sale_month, sale_day)
    ( PARTITION sale_q1 VALUES LESS THAN (1999, 04, 01)
    TABLLESPACE tsa STORAGE (INITIAL 20K, NEXT 10K),
    PARTITION sale_q2 VALUES LESS THAN (1999, 07, 01)
    TABLLESPACE tsb,
    PARTITION sale_q3 VALUES LESS THAN (1999, 10, 01)
    TABLLESPACE tsc,
    PARTITION sale_q4 VALUES LESS THAN (2000, 01, 01)
    TABLLESPACE tsd )
    ENABLE ROW MOVMENT;

    说明：在表层级指定了存储参数个LOGGING属性，而在分区sale_q1中的存储参数进行重置，原因是第一季度业务较少。另外使用ENABLE ROW MOVMENT子句，表示如果键值更改了，就允许将行迁移到新分区。

    另外创建一个范围分区的全局索引如下：

    CREATE INDEX month_ix ON sales(sales_month)
    GROBAL PARTITION BY RANGE(sales_month)
    (PARTITION pm1_ix VALUES LESS THAN (2)
    PARTITION pm2_ix VALUES LESS THAN (3)
    PARTITION pm3_ix VALUES LESS THAN (4)
    PARTITION pm4_ix VALUES LESS THAN (5)
    PARTITION pm5_ix VALUES LESS THAN (6)
    PARTITION pm6_ix VALUES LESS THAN (7)
    PARTITION pm7_ix VALUES LESS THAN (8)
    PARTITION pm8_ix VALUES LESS THAN (9)
    PARTITION pm9_ix VALUES LESS THAN (10)
    PARTITION pm10_ix VALUES LESS THAN (11)
    PARTITION pm11_ix VALUES LESS THAN (12)
    PARTITION pm12_ix VALUES LESS THAN (MAXVALUE));

    2、创建散列分区表

    使用PARTITION BY HASH子句来表明散列分区，使用PARTITIONS子句来指定要创建的分区数量，另外使用PARTITION子句来命名各个分区及其表空间，但是只能指定TABLESPACE属性，其他的属性只能继承于表层次。举例如下：

    CREATE TABLE dept (deptno NUMBER, dept name VARCHAR2(32))
    STORAGE (INITIAL 10K)
    PARTITION BY HASH (deptno)
    (PARTITION p1 TABLESPACE ts1, PARTITION p2 TABLESPACE ts2,
    PARTITION p3 TABLESPACE ts3, PARTITION p4 TABLESPACE ts4);

    为上表创建局部索引，则Oracle会自动创建一个与基础表同分区的索引。

    CREATE INDEX locd_dept_ix ON dept(deptno) LOCAL

    3、创建列表分区表

    使用PARTITION BY LIST子句来表明列表分区，使用PARTITION子句指定一串文字值，即为分区列的离散值。另外PARTITION子句下级子句可以指定特别用于该分区段的物理属性，如果没有重载，则自动继承基础表的属性。

    此类型基本与上面的举例相同，不再重新举例。

    4、创建组合分区表

    先使用PARTITION BY RANGE子句，然后指定一个与PARTITION BY HASH语句遵从语法和规则的SUBPARTITION BY HASH子句来表明组合分区，各个PARTITION子句后面紧跟SUBPARTITION或SUBPARTITIONS子句。

    另外可以为每个(范围)分区指定不同的属性，另外还可以使用STORE IN子句来指定不同的不同的表空间。

    CREATE TABLE emp (deptno NUMBER, empname VARCHAR(32), grade NUMBER)
    PARTITION BY RANGE (deptno) SUBPARTITION BY HASH(empname)
    SUBPARTITIONS 8 STORE IN (ts1, ts3, ts5, ts7)
    (PARTITION p1 VALUES LESS THAN (1000) PCTFREE 40,
    PARTITION p2 VALUES LESS THAN (2000)
    STORE IN (ts2, ts4, ts6, ts8),
    PARTITION p3 VALUES LESS THAN (MAXVALUE)
    (SUBPARTITION p3_s1 TABLESPACE ts4,
    SUBPARTITION p3_s2 TABLESPACE ts5));

    另创建一个局部索引，且分段分布于表空间ts7、ts8、ts9

    CREATE INDEX emp_ix ON emp(deptno)
    LOCAL STORE IN (ts7, ts8, ts9);

    5、创建分局索引结构表

    可以对索引结构表使用范围分区或散列分区，只有范围分区索引结构表才能包含LOB数据类型的列。

    创建范围分区或散列分区索引结构表与创建普通表相似，但也有区别，区别在于：
    ● 创建该表时需要指定ORGANIZATION INDEX子句，需要时还要指定INCLUDING和OVERFLOW子句
    ● PARTITION或PARTITIONS子句可以有OVERFLOW下级子句，允许在分区层次上指定溢出段的属性

    注：索引结构表的分区列集合必须是主键列的子集，因为索引结构表的行是按表的主键索引存储的，通过将分区键选成主键的子集，插入操作就只需要校验在单个分区中的主键的唯一性，因此对分区的维护就互不依赖了。

    a.创建范围分区索引结构表

    CREATE TABLE sales(acct_no NUMBER(5),
    acct_name CHAR(30),
    amount_of_sale NUMBER(6),
    week_no INTEGER,
    SALE_DETAILES varchar2(1000),
    PRIMARY KEY (acct_no, acct_name, week_no))
    ORGANIZATION INDEX
    INCLUDING week_no
    OVERFLOW TABLESPACE overflow_here
    PARTITION BY RANGE (week_no)
    (PARTITION VALUES LESS THAN (5)
    TABLESPACE ts1,
    PARTITION VALUES LESS THAN (9)
    TABLESPACE ts2 OVERFLOW TABLESPACE overflow_ts2,
    ...
    PARTITION VALUES LESS THAN (MAXVALUE)
    TABLESPACE ts13);

    说明：
    1、INCLUDING子句指定将week_no列之后的所有列都存储在溢出段中。
    2、每个分区有一个溢出段，都存储在相同的表空间(overflow_here)中。
    3、通过OVERFLOW TABLESPACE子句指定各个分区层次的溢出表空间。

    b. 创建散列分区索引结构表

    CREATE TABLE sales(acct_no NUMBER(5),
    acct_name CHAR(30),
    amount_of_sale NUMBER(6),
    week_no INTEGER,
    sale_details VARCHAR2(1000),
    PRIMARY KEY (acct_no, acct_name, week_no))
    ORGANIZATION INDEX
    INCLUDING week_no
    OVERFLOW
    PARTITION BY HASH (week_no)
    PARTITIONS 16
    STORE IN (ts1, ts2, ts3, ts4)
    OVERFLOW STORE IN (ts3, ts6, ts9);

    建议在创建具有可变分区键的散列分区索引结构表时，明确指定ROW MOVEMENT ENABLE子句，因为一个好的散列函数会将各行做一个很好的平衡分布，所以改变主键列很有可能会移动到其他分区。

    6 、多个数据块大小的分区限制

    若在具有多个数据块大小的表空间中创建分区对象时需要特别留意，因为分区对象存储到这些表空间时会受到某些限制。例如以下的分区必须存储在具有相同数据块大小的表空间中：

    ● 常规表
    ● 索引
    ● 索引结构表的主键索引段
    ● 索引结构表的溢出段
    ● 在外存储的LOB列

时间： 2024-07-31 13:38:44

数据库分区分表

数据库分区分表的相关文章

数据库分区分表以及读写分离

海量数据查询关系型数据库存储大数据，要点就是：简单存储、分区分表、高效索引、批量写入

MySql之分区分表

FreeSql （三十一）分区分表

mysql分库分区分表

MySQL分区分表

postgresql10以上的自动分区分表功能

zabbix分区分表

Atitit数据库层次架构表与知识点 attilax 总结