Oracle亿级数据查询处理(数据库分表、分区实战)

大数据量的查询,不仅查询速度非常慢,而且还会导致数据库经常宕机(刚接到这个项目时候,数据库经常宕机o(╯□╰)o)。 那么,如何处理上亿级的数据量呢?如何从数据库经常宕机到上亿数据秒查?仅以此篇文章作为处理的总结。

数据背景:
下面是存放历史数据表的数据量,数据量确实很大,3亿多条。但这也仅仅是测试数据而已,因为客户端服务器上的数据可能远不止于此。

为什么说远不止于此呢?实际情况是这样的:

有一个实时数据表,THTF_TABLE_AI,以及历史数据表,THTF_TABLE_AI_HIS

实时数据表固定3万条数据(客户推送过来的数据),每2小时刷新一次,每刷新一次就往历史表中插入一次数据。

可以算一下,历史表中数据量的数据量:

3 x 12 x 30 = 1080万,也就是每个月存储1080条数据,1年就1亿多的数据量。这样大的数据量,导致查询速度慢,估计用户会气炸的...

解决方案:
第一步:分表

如果历史表中存储了很多年的数据,会造成严重的数据冗余。那如果将历史表分表存储,比如每年创建一个表,数据存储到对应的年表中,必定会减少很多数据量。(如果分成年表数据量还是过大,可以细分到月表,天表...)。

我们这里以创建年表为例,写一个创建年表的存储过程,利用PLSQL定时任务定时执行此存储过程(定时每年12月31号创建下一年的年表)。存储过程如下,定时任务查看此篇文章:PLSQL执行Oracle定时任务

CREATE OR REPLACE
PROCEDURE CREATE_YEAR_TABLE IS
/*变量*/
grantSql VARCHAR2(50);
yearStr VARCHAR2(4);
tableCount int(2);
createSql VARCHAR2(1000);
BEGIN
/*权限*/
grantSql := ‘grant create any table to thtf_taiyuan‘;
EXECUTE IMMEDIATE grantSql;
/*创建年表 注意create table 后边的空格*/
SELECT TO_CHAR(SYSDATE, ‘yyyy‘)+1 INTO yearStr FROM dual;
createSql := ‘CREATE TABLE ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr ||
‘( SHE_SHI_CODE VARCHAR2(100),
SHE_SHI_TYPE NUMBER DEFAULT 1,
FEN_GONG_SI VARCHAR2(100),
SHUI_HAO NUMBER(20,4) DEFAULT 0,
PRE_SHUI_HAO NUMBER(20,4) DEFAULT 0,
DIAN_HAO NUMBER(20,4) DEFAULT 0,
PRE_DIAN_HAO NUMBER(20,4) DEFAULT 0,
RE_HAO NUMBER(20,4) DEFAULT 0,
PRE_RE_HAO NUMBER(20,4) DEFAULT 0,
SHI_JIAN DATE DEFAULT SYSDATE,
STATE NUMBER DEFAULT 1 )‘;
SELECT COUNT(1) INTO tableCount FROM user_tables WHERE table_name = CONCAT(‘THTF_TABLE_YEAR_‘, yearStr);
IF tableCount = 0 THEN
EXECUTE IMMEDIATE createSql;
COMMIT;
END IF;
END CREATE_YEAR_TABLE;
第二步:分区

年表创建过后,查询就是查询年表中的数据,可是虽然分表了,但是年表中的数据量仍然很大,查询速度虽然有提升,但并不能满足用户的要求。便考虑到分表再分区,即将历史数据以不同的年表来存储,在年表中按月分区。

说道分区,要恶补一下了~

数据库分区:就是减少SQL操作的数据量,从而提升查询效率。表分区后,逻辑上仍然是一张表,只不过将表中的数据在物理上存放到多个表空间上。这样在查询数据时,会查询相应分区的数据,避免了全表扫描。

分区又分为水平分区、垂直分区。

水平分区:就是对行进行分区,举个例子来说,就是一个表中有1000万条数据,每100万条数据划一个分区,这样就将表中数据分到10个分区中去。水平分区要通过某个特定的属性列进行分区,比如我用的列就是Date时间。

垂直分区:通过对标垂直划分来减少表的宽度,从而提升查询效率。比如一个学生表中,有他相关的信息列,还有论文列以CLOB存储。这些以CLOB存储的论文并不会经常被访问到,这时候就要把这些不经常使用的CLOB划分到另一个分区,需要访问时再调用它。

总的来说,分区的主要目的还是避免了全表扫描,从而提升查询速度。

接下来在上面的存储过程的基础上,我们创建按月分区。

CREATE OR REPLACE
PROCEDURE CREATE_YEAR_TABLE IS
grantSql VARCHAR2(50);
yearStr VARCHAR2(4);
tableCount int(2);
createSql VARCHAR2(1000);
BEGIN
/*权限*/
grantSql := ‘grant create any table to thtf_taiyuan‘;
EXECUTE IMMEDIATE grantSql;
/*创建年表 注意create table 后边的空格*/
SELECT TO_CHAR(SYSDATE, ‘yyyy‘)+1 INTO yearStr FROM dual;
createSql := ‘CREATE TABLE ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr ||
‘( SHE_SHI_CODE VARCHAR2(100),
SHE_SHI_TYPE NUMBER DEFAULT 1,
FEN_GONG_SI VARCHAR2(100),
SHUI_HAO NUMBER(20,4) DEFAULT 0,
PRE_SHUI_HAO NUMBER(20,4) DEFAULT 0,
DIAN_HAO NUMBER(20,4) DEFAULT 0,
PRE_DIAN_HAO NUMBER(20,4) DEFAULT 0,
RE_HAO NUMBER(20,4) DEFAULT 0,
PRE_RE_HAO NUMBER(20,4) DEFAULT 0,
SHI_JIAN DATE DEFAULT SYSDATE,
STATE NUMBER DEFAULT 1 )
/*按月分区*/
PARTITION BY RANGE(SHI_JIAN)
INTERVAL(NUMTOYMINTERVAL(1,‘‘‘ || ‘MONTH‘ || ‘‘‘))
( PARTITION PART1 VALUES LESS THAN(TO_DATE(‘‘‘|| CONCAT(yearStr, ‘-11-01‘) ||‘‘‘,‘‘‘|| ‘YYYY-MM-DD‘ ||‘‘‘)) )‘;
SELECT COUNT(1) INTO tableCount FROM user_tables WHERE table_name = CONCAT(‘THTF_TABLE_YEAR_‘, yearStr);
IF tableCount = 0 THEN
EXECUTE IMMEDIATE createSql;
--添加注释
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.SHE_SHI_CODE IS ‘‘设施编号‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.SHE_SHI_TYPE IS ‘‘设施类型‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.FEN_GONG_SI IS ‘‘分公司‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.SHUI_HAO IS ‘‘水耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.PRE_SHUI_HAO IS ‘‘上一小时水耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.DIAN_HAO IS ‘‘电耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.PRE_DIAN_HAO IS ‘‘上一小时电耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.RE_HAO IS ‘‘热耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.PRE_RE_HAO IS ‘‘上一小时热耗‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.SHI_JIAN IS ‘‘时间‘‘‘;
EXECUTE IMMEDIATE ‘COMMENT ON COLUMN ‘ || ‘THTF_TABLE_YEAR_‘ || yearStr || ‘.STATE IS ‘‘状态值‘‘‘;
COMMIT;
END IF;
END CREATE_YEAR_TABLE;
如果分区要细化到天,将分区语句改为如下:

PARTITION BY RANGE(SHI_JIAN)
INTERVAL(NUMTOYMINTERVAL(1,‘‘‘ || ‘DAY‘ || ‘‘‘))
( PARTITION PART1 VALUES LESS THAN(TO_DATE(‘‘‘|| CONCAT(yearStr, ‘-01-01‘) ||‘‘‘,‘‘‘|| ‘YYYY-MM-DD‘ ||‘‘‘)) )‘;
创建完分区后,如何查询表中有哪些分区呢?

--查分区数
SELECT table_name,partition_name from user_tab_partitions where table_name = ‘THTF_TABLE_YEAR_2017‘
如何查询分区中的数据呢?

--查分区数据
SELECT * FROM THTF_TABLE_YEAR_2017 PARTITION(PART1)
 
---------------------
作者:_Rt
来源:CSDN
原文:https://blog.csdn.net/rongtaoup/article/details/82457544
版权声明:本文为博主原创文章,转载请附上博文链接!

原文地址:https://www.cnblogs.com/ShaYeBlog/p/10383644.html

时间: 2024-11-08 12:48:06

Oracle亿级数据查询处理(数据库分表、分区实战)的相关文章

MySQL数据库分表分区(一)(转)

面对当今大数据存储,设想当mysql中一个表的总记录超过1000W,会出现性能的大幅度下降吗? 答案是肯定的,一个表的总记录超过1000W,在操作系统层面检索也是效率非常低的 解决方案: 目前针对海量数据的优化有两种方法: 1.大表拆小表的方式(主要有分表和分区两者技术) (1)分表技术 垂直分割 优势:降低高并发情况下,对于表的锁定. 不足:对于单表来说,随着数据库的记录增多,读写压力将进一步增大. 水平分割 如果单表的IO压力大,可以考虑用水平分割,其原理就是通过hash算法,将一张表分为N

MySQL 数据库分表分区

博主QQ:819594300 博客地址:http://zpf666.blog.51cto.com/ 有什么疑问的朋友可以联系博主,博主会帮你们解答,谢谢支持!一.分表 为什么要分表? 我们的数据库数据越来越大,随之而来的是单个表中数据太多.以至于查询书读变慢,而且由于表的锁机制导致应用操作也搜到严重影响,出现了数据库性能瓶颈. 什么是分表? 分表是将一个达标按照一定的规则分解成多张具有独立存储空间的实体表,每个表都对应三个文件,.MYD数据文件..MYI索引文件..frm表结构文件.这些表可以分

mysql数据库分表分区

防伪码:博观而约取,厚积而薄发 为什么要分表和分区? 我们的数据库数据越来越大,随之而来的是单个表中数据太多.以至于查询书读变慢,而且 由于表的锁机制导致应用操作也搜到严重影响,出现了数据库性能瓶颈. mysql 中有一种机制是表锁定和行锁定,是为了保证数据的完整性.表锁定表示你们都不能 对这张表进行操作,必须等我对表操作完才行.行锁定也一样,别的 sql 必须等我对这条数 据操作完了,才能对这条数据进行操作.当出现这种情况时,我们可以考虑分表或分区. 1.分表 什么是分表? 分表是将一个大表按

Oracle学习(十四)分表分区

本文借鉴:Oracle亿级数据查询处理.Oracle 分区表使用和查询.垂直分区+水平分区(特此感谢!) 一.前言 大数据量的查询,不仅查询速度非常慢,而且还会导致数据库经常宕机,在尝试添加索引及查询方式修改后,还有没有更有效的解决方案呢? 分库.分表.分区这些概念咱就应该了解一下. 二.分表 假如一个大型商城有一个订购关系表,每个用户的订单都落在这个表里面,那么时间一长,要进行查询的时候,肯定慢得要死,这样的系统给客户用,那就凉凉思密达了... 拆分思想 咱可以对这个总表进行拆分,例如对年进行

数据库分表分库

产生原因 1.当数据达到了上亿级别单个库使用效率性能是十分低下的,当进行查询等操作时候,也是从根节点去找到子节点然后在找到叶节点 , 数亿条取一条数据 性能就不是很迅速,而且单机的存储量,链接数,并发量,处理能力十分有限. 这个时候数据库就容易遇到了系统瓶颈, 所以为了 降低性能,缩短查询时间,减少数据库的负担,会采取分表分库的方法 . 数据库分表分库思路:水平拆分和垂直拆分 垂直拆分:就是不同的表存储在不同的数据库,按照业务进行独立划分 ,主要通过'列'进行划分,将不常用的字段或者较大的字段拆

数据库分表设计-任我行

本文只阐述一个完整的实例,直接可以复制过去用,不作过多的解释. 简单说一下分表与分区: 分区的原理:我在深圳市,但我也在中国,如果中国没有划分区域的话,搜索范围将是整个中国,查询起来很费力.现在既然中国已经划分区域当然可以直接来深圳市找我了,是不是快了很多. 分表的原理:我在中国,通过某种算法(比如查户口)知道了我在深圳,是不是也可以直接来深圳市找我,其他区域就不用去看了,本文的算法为dbo.GetTableName(),通过这个算法知道了数据存储在哪张表里面. --用于保存所有日志ID,与操作

数据库分表和分库的原理及基于thinkPHP的实现方法

为什么要分表,分库: 当我们的数据表数据量,访问量很大,或者是使用频繁的时候,一个数据表已经不能承受如此大的数据访问和存储,所以,为了减轻数据库的负担,加快数据的存储,就需要将一张表分成多张,及将一类数据存入不同的几张表,当分表已经不能满足需求是,我们还可以分库,及用几个数据库存储. 分表会随着需求和功能的不同有不同的实现方法,下面是我做项目中的一个例子: 需求:product,product_price两张表是一对多的关系,及产品和产品每日的价格,一个产品对应几种价格,现在由于产品表数据量很大

数据库优化 | 亿级数据量系统数据库性能优化方案

一.数据库性能瓶颈主要原因 1.数据库连接 MySQL数据库默认连接为100,我们可以通过配置initialSize.minIdle.maxActive等进行调优,但由于硬件资源的限制,数据库连接不可能无限制的增加,对大型单体应用单实例数据库可能会出现最大连接数不能满足实际需求的情况,这时就会系统业务阻塞. 2.表数据量大(空间存储问题) 普遍观点认为单表数据量超过1000万条时就是出现数据库读取性能瓶颈.从索引角度分析,如果索引未被命中,数据库系统就会全表扫描,数据量越大,扫描全表的时间就会越

亿条数据在PHP中实现Mysql数据库分表100张

当数据量猛增的时候,大家都会选择库表散列等等方式去优化数据读写速度.笔者做了一个简单的尝试,1亿条数据,分100张表.具体实现过程如下: 首先创建100张表: 1 $i=0; 2 while($i<=99){ 3 echo "$newNumber \r\n"; 4 $sql="CREATE TABLE `code_".$i."` ( 5  `full_code` char(10) NOT NULL, 6  `create_time` int(10)