QunInfo群数据库的还原与优化

一、 背景

  这个数据库的数据文件mdf大概有8.5G左右,当还原数据库之后感觉可以做很多性能方面上的调优,合并数据后mdf数据文件大概有6.2G左右,行压缩后mdf数据文件大概有4.8G左右,页压缩后mdf数据文件大概有4.5G左右,这里处于技术研究的目的,讲讲研究的成果分析,不用于商业目的;

二、 优化项

我们可以从下面3个不同的方面来优化这两个数据库:

(一)对表进行分区;

(二)使用行压缩,压缩行数据;

(三)重新设计表结构,优化表空间;

三、 附加数据库

1.先把11个QunInfo(群信息)数据库附加到数据库,下面的导入SQL语句在原来的基础上做了些修改:统一数据库名,这样做的好处就是后面做处理的时候方便按照顺序执行数据库;

--附加数据库
EXEC sp_attach_db "QunInfo01", "D:\DBBackup\QunData\QunInfo1_Data.MDF"
EXEC sp_attach_db "QunInfo02", "D:\DBBackup\QunData\QunInfo2_Data.MDF"
EXEC sp_attach_db "QunInfo03", "D:\DBBackup\QunData\QunInfo3_Data.MDF"
EXEC sp_attach_db "QunInfo04", "D:\DBBackup\QunData\QunInfo4_Data.MDF"
EXEC sp_attach_db "QunInfo05", "D:\DBBackup\QunData\QunInfo5_Data.MDF"
EXEC sp_attach_db "QunInfo06", "D:\DBBackup\QunData\QunInfo6_Data.MDF"
EXEC sp_attach_db "QunInfo07", "D:\DBBackup\QunData\QunInfo7_Data.MDF"
EXEC sp_attach_db "QunInfo08", "D:\DBBackup\QunData\QunInfo8_Data.MDF"
EXEC sp_attach_db "QunInfo09", "D:\DBBackup\QunData\QunInfo9_Data.MDF"
EXEC sp_attach_db "QunInfo10", "D:\DBBackup\QunData\QunInfo10_Data.MDF"
EXEC sp_attach_db "QunInfo11",
"D:\DBBackup\QunData\QunInfo11_Data.MDF"

四、 合并数据库

2.修改各个数据库中表的名字:把QunList1统一修改为QunList01这样格式的,这样做的好处就是在合并数据的时候读取到的数据库的数据是按照顺序插入到表中的,不会造成数据页的拆分;

--格式化表名
USE QunInfo01
GO

exec sp_rename ‘QunList1‘,‘QunList01‘
exec sp_rename ‘QunList2‘,‘QunList02‘
exec sp_rename ‘QunList3‘,‘QunList03‘
exec sp_rename ‘QunList4‘,‘QunList04‘
exec sp_rename ‘QunList5‘,‘QunList05‘
exec sp_rename ‘QunList6‘,‘QunList06‘
exec sp_rename ‘QunList7‘,‘QunList07‘
exec sp_rename ‘QunList8‘,‘QunList08‘
exec sp_rename ‘QunList9‘,‘QunList09‘

3.创建一个名为QunInfo的数据库,设置数据库为简单恢复模式;

4.在QunInfo数据库中创建一个临时表:tables,用来保存所有的数据库与表的信息,提供数据库合并用;

--创建临时表
CREATE TABLE [QunInfo].[dbo].[tables](
    [db_name] [sysname] NULL,
    [table_name] [sysname] NULL,
    [status] [bit] default 0
) ON [PRIMARY]

--生成数据库名称与表名称的对应列表
EXEC sp_MSForEachDB ‘USE [?];
    --插入表信息
    INSERT INTO [QunInfo].[dbo].[tables]([table_name])
        SELECT name from [?].sys.tables where name like ‘‘QunList%‘‘ order by name
    --更新数据库名称
    UPDATE [QunInfo].[dbo].[tables] SET [db_name] = ‘‘?‘‘ WHERE [db_name]

五、 优化数据库

5.经过评估,11个QunInfo数据库的QunList表数据的总和大概有9千万,QunList表中QunNum(群号)字段的最大值为100219998(可以通过QunInfo11数据库的QunList110表查询到:SELECT MAX(QunNum) FROM [QunInfo11].[dbo].[QunList110]),从业务的角度,可能需要查询某群的信息,所以这里就以QunNum作为分区,每1千万个群作为一个分区,这样计算那就需要11个文件组,如果你希望和GroupData数据库的Group表对齐的话,也可以按照5百万个群作为一个分区;

6.下面是一个创建分区脚本的SQL脚本,执行下面的SQL会生成一个新的脚本,执行那个脚本就可以创建11个文件组、分区函数和分区方案;

--生成分区脚本
DECLARE @DataBaseName NVARCHAR(50)--数据库名称
DECLARE @TableName NVARCHAR(50)--表名称
DECLARE @ColumnName NVARCHAR(50)--字段名称
DECLARE @PartNumber INT--分区最大编号
DECLARE @PartNumberBegin INT--分区编号开始值
DECLARE @PartNumberBeginTemp INT--分区编号开始值临时值
DECLARE @PartNumberStr NVARCHAR(50)--分区值字符串
DECLARE @Location NVARCHAR(50)--保存分区文件的路径
DECLARE @Size NVARCHAR(50)--分区初始化大小
DECLARE @FileGrowth NVARCHAR(50)--分区文件增量
DECLARE @FunValue INT--分区分段值增量
DECLARE @FunValueBegin INT--分区分段值开始值
DECLARE @i INT--临时变量
DECLARE @sql NVARCHAR(max)

--设置下面变量
SET @DataBaseName = ‘QunInfo‘
SET @TableName = ‘QunList‘
SET @ColumnName = ‘QunNum‘
SET @PartNumber = 11
SET @PartNumberBegin = 1
SET @Location = ‘D:\DBBackup\FG_QunList\‘
SET @Size = ‘1024MB‘
SET @FileGrowth = ‘1024MB‘
SET @FunValueBegin = 10000000
SET @FunValue = 10000000

SET @sql = ‘USE [‘+@DataBaseName +‘]
GO‘
PRINT @sql + CHAR(13)

--1.创建文件组
SET @i = 1
SET @PartNumberBeginTemp = @PartNumberBegin
PRINT ‘--1.创建文件组‘
WHILE @i <= @PartNumber
BEGIN
    SET @PartNumberStr =  RIGHT(‘0‘ + CONVERT(NVARCHAR,@PartNumberBeginTemp),2)
    SET @sql = ‘ALTER DATABASE [‘+@DataBaseName +‘]
ADD FILEGROUP [FG_‘+@TableName+‘_‘+@ColumnName+‘_‘+@PartNumberStr+‘]‘
    PRINT @sql + CHAR(13)
    SET @i=@i+1
    SET @PartNumberBeginTemp = @PartNumberBeginTemp+1
END

--2.创建文件
SET @i = 1
SET @PartNumberBeginTemp = @PartNumberBegin
PRINT CHAR(13)+‘--2.创建文件‘
WHILE @i <= @PartNumber
BEGIN
    SET @PartNumberStr =  RIGHT(‘0‘ + CONVERT(NVARCHAR,@PartNumberBeginTemp),2)
    SET @sql = ‘ALTER DATABASE [‘+@DataBaseName +‘]
ADD FILE
(NAME = N‘‘FG_‘+@TableName+‘_‘+@ColumnName+‘_‘+@PartNumberStr+‘_data‘‘,FILENAME = N‘‘‘+@Location+‘FG_‘+@TableName+‘_‘+@ColumnName+‘_‘+@PartNumberStr+‘_data.ndf‘‘,SIZE = ‘+@Size+‘, FILEGROWTH = ‘+@FileGrowth+‘ )
TO FILEGROUP [FG_‘+@TableName+‘_‘+@ColumnName+‘_‘+@PartNumberStr+‘];‘
    PRINT @sql + CHAR(13)
    SET @i=@i+1
    SET @PartNumberBeginTemp = @PartNumberBeginTemp+1
END

--3.创建分区函数
PRINT CHAR(13)+‘--3.创建分区函数‘
DECLARE @FunValueStr NVARCHAR(MAX)
DECLARE @PNB INT
SET @i = 1
SET @PNB = 1
SET @FunValueStr = convert(NVARCHAR(50),@FunValueBegin) + ‘,‘
WHILE @i < @PartNumber-1
BEGIN
    SET @FunValueStr = @FunValueStr + convert(NVARCHAR(50),(@FunValueBegin+@PNB*@FunValue)) + ‘,‘
    SET @i=@i+1
    SET @PNB=@PNB+1
END
SET @FunValueStr = substring(@FunValueStr,1,len(@FunValueStr)-1)
SET @sql = ‘CREATE PARTITION FUNCTION
[Fun_‘+@TableName+‘_‘+@ColumnName+‘](INT) AS
RANGE RIGHT
FOR VALUES(‘+@FunValueStr+‘)‘
PRINT @sql + CHAR(13)

--4.创建分区方案
PRINT CHAR(13)+‘--4.创建分区方案‘
DECLARE @FileGroupStr NVARCHAR(MAX)
SET @i = 1
SET @PartNumberBeginTemp = @PartNumberBegin
SET @FileGroupStr = ‘‘
WHILE @i <= @PartNumber
BEGIN
    SET @PartNumberStr =  RIGHT(‘0‘ + CONVERT(NVARCHAR,@PartNumberBeginTemp),2)
    SET @FileGroupStr = @FileGroupStr + ‘[FG_‘+@TableName+‘_‘+@ColumnName+‘_‘+@PartNumberStr+‘],‘
    SET @i=@i+1
    SET @PartNumberBeginTemp = @PartNumberBeginTemp+1
END
SET @FileGroupStr = substring(@FileGroupStr,1,len(@FileGroupStr)-1)
SET @sql = ‘CREATE PARTITION SCHEME
[Sch_‘+@TableName+‘_‘+@ColumnName+‘] AS
PARTITION [Fun_‘+@TableName+‘_‘+@ColumnName+‘]
TO(‘+@FileGroupStr+‘)‘
PRINT @sql + CHAR(13)

--5.分区函数的记录数
PRINT CHAR(13)+‘--5.分区函数的记录数‘
SET @sql = ‘SELECT $PARTITION.[Fun_‘+@TableName+‘_‘+@ColumnName+‘](‘+@ColumnName+‘) AS Partition_num,
  MIN(‘+@ColumnName+‘) AS Min_value,MAX(‘+@ColumnName+‘) AS Max_value,COUNT(1) AS Record_num
FROM dbo.[‘+@TableName+‘]
GROUP BY $PARTITION.[Fun_‘+@TableName+‘_‘+@ColumnName+‘](‘+@ColumnName+‘)
ORDER BY $PARTITION.[Fun_‘+@TableName+‘_‘+@ColumnName+‘](‘+@ColumnName+‘);‘
PRINT @sql + CHAR(13)

7.下面重新对QunList表进行设计,涉及的内容如下:

1) 在QunInfo数据库中创建分区表QunList,这里已经把原表的ID字段去掉了,这个字段并没有太大的意义;

2) 以[QunNum]作为聚集索引,而且是唯一的,这个需要开启IGNORE_DUP_KEY = ON选项,这样才可以在批量插入的时候忽略重复值;

3) 对原表的[MastQQ]字段从int类型变成smallint ,[CreateDate]字段从varchar(10)类型变为date,数据类型修改是为了减少表占用的空间,

4) 使用刚刚创建好的分区方案,之后创建的索引进行索引对齐;

5) 对表使用行压缩,减少数据库占用空间;

6) 对表进行页压缩会更节省空间?

--创建优化后的QunList表
CREATE TABLE [dbo].[QunList](
    [QunNum] [int] NOT NULL,
    [MastQQ] [smallint] NULL,
    [CreateDate] [date] NULL,
    [Title] [varchar](22) NULL,
    [Class] [varchar](38) NULL,
    [QunText] [varchar](80) NULL,
 CONSTRAINT [PK_QunList2] PRIMARY KEY CLUSTERED
(
    [QunNum] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, IGNORE_DUP_KEY = ON, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON, DATA_COMPRESSION = ROW) ON [Sch_QunList_QunNum]([QunNum])
) ON [Sch_QunList_QunNum]([QunNum])
GO

(Figure1:GroupData原表结构)

(Figure2:GroupData新表结构)

8.把11个数据库都合并到新创建的QunInfo的QunList表中;

--合并数据
DECLARE @tablename sysname
DECLARE @dbname sysname
DECLARE @sql NVARCHAR(max)

--游标
DECLARE @itemCur CURSOR
SET @itemCur = CURSOR FOR
    SELECT db_name,table_name from [QunInfo].[dbo].[tables]

OPEN @itemCur
FETCH NEXT FROM @itemCur INTO @dbname,@tablename
WHILE @@FETCH_STATUS=0

BEGIN

    SET @sql = ‘
    INSERT INTO [QunInfo].[dbo].[QunList]
           ([QunNum]
           ,[MastQQ]
           ,[CreateDate]
           ,[Title]
           ,[Class]
           ,[QunText])
    SELECT [QunNum]
      ,[MastQQ]
      ,[CreateDate]
      ,[Title]
      ,[Class]
      ,[QunText]
    FROM [‘+@dbname+‘].[dbo].[‘+@tablename+‘]‘

    EXEC(@sql)

    UPDATE [QunInfo].[dbo].[tables] SET status = 1 WHERE db_name = @dbname AND table_name = @tablename

    --返回SQL
    PRINT(@sql)PRINT(‘GO‘)+CHAR(13)

    FETCH NEXT FROM @itemCur INTO @dbname,@tablename
END 

CLOSE @itemCur
DEALLOCATE @itemCur

(Figure3:QunList表分区记录数)

(Figure4:QunList数据行压缩前)

(Figure5:QunList数据行压缩后)

我们使用页压缩修改表QunList,看看数据占用大小的情况:

--页压缩
ALTER TABLE [QunList]
REBUILD WITH (DATA_COMPRESSION = PAGE );

(Figure6:QunList数据页压缩后)

时间: 2024-12-17 00:31:59

QunInfo群数据库的还原与优化的相关文章

GroupData群数据库的还原与优化

一.背景 这个数据库的数据文件mdf大概有83G左右,当还原数据库之后感觉可以做很多性能方面上的调优,合并数据后mdf数据文件大概有59G左右,行压缩后mdf数据文件大概有39G左右,页压缩后mdf数据文件大概有34G左右,这里处于技术研究的目的,讲讲研究的成果分析,不用于商业目的: 二.优化项 我们可以从下面4个不同的方面来优化这两个数据库: (一)对表进行分区: (二)创建合适表索引: (三)使用行压缩,压缩行数据: (四)重新设计表结构,优化表空间: 三.附加数据库 1.先把11个Grou

SQL server 2005数据库的还原与备份

一.SQL数据库的备份: 1.依次打开 开始菜单 → 程序 → Microsoft SQL Server 2005→SQL Server Management Studio ,这里我以UMVTEST命名的数据库来教大家备份功能: 2.选择要备份的数据库"UMVTEST",点击鼠标右键 → 任务 → 备份,如图: 二.SQL数据库的还原: 1.选择您要还原的数据库"UMVTEST",点击鼠标右键 → 任务 → 还原 → 数据库,如图: 2.在出现的"还原数据

windows server2012R2 数据库的还原

域数据库的还原 实例一:模拟数据的误操作 步骤一:新建一个用户 单击右上角上的工具,打开用户和计算机 进入这个界面 在Domain controllers 上右键,新建组织单位,随便命名,这里我命名为OU,在新建的组织单位上右键,新建一个用户,命名为zs 确定 步骤二:进入目录恢复模式,重新启动计算机-----F8(目录服务恢复模式) 单击工具,里面有一个windows server backup,打开 本地备份-----恢复 此服务器 确定恢复 要重新启动 步骤三:数据还原成功计算机重新启动,

SQL server数据库备份还原问题备忘(亲测有效)

问题一:SQL server数据库备份还原方法 http://www.cnblogs.com/zgqys1980/archive/2012/07/04/2576382.html 问题二:无法执行 BACKUP LOG,因为当前没有数据库备份 http://blog.csdn.net/aojiancc2/article/details/46316451 问题三:还原数据库失败 备份集中数据库备份与现有数据库不同 http://jingyan.baidu.com/article/fb48e8be52

泄露QQ群数据库之简单分析(QQ数据库.7z.001-006)

笔者心血来潮, 网上下来QQ泄露的群数据库. 压缩文件, 总计 24.5GB, 解压后90+G. 包含两部分信息: 群信息 + 群内成员信息 挂载部分数据库 群信息-1, 群信息数据采用分库分表的方式处理持续增长的数据信息,可扩展性不成问题.一个库包含10张表, 每张表数据量上限100W左右. 群信息-2,只包含基本信息, 群号,Title, 描述 群成员信息-1, 同样采用分库分表, 一库对应100张表. 群成员信息-2, 只包含简单的群组对应关系,没有任何密码之类的泄露. 1. 数据库是SQ

SQL Server数据库中还原孤立用户的方法集合

SQL Server数据库中还原孤立用户的方法集合 虽然SQL Server现在搬迁的技术越来越多,自带的方法也越来越高级. 但是我们的SQL Server在搬迁的会出现很多孤立用户,微软没有自动的处理. 因为我们的数据库权限表都不会在应用数据库中,但是每次对数据库作迁移的时候,单个数据库却带着它的数据库用户对象. 并且我们在新的数据库机器上也不能登录这些账号,但是它却静悄悄的存在我们的数据库中. 微软以前提供的一个老的接口存储过程来处理这个问题. sp_change_users_login 将

windows server 2012R2数据库的还原

windows server 2012R2 数据库的还原 实例:模拟服务器的崩溃 在实际的工作环境中,由于管理员的误操作和服务器自身的原因会造成数据的破坏或丢失,若是管理员的误操作还可以将备份在本地的数据恢复回来,若是数据库崩溃那数据从本地是恢复不回来的,下面,我们模拟服务器崩溃,在服务器崩溃之前将数据备份到其他服务器上. 模拟服务器: server01是准备要崩溃的服务器              server02是一个全新的,也就是后来盛放数据的服务器 准备工作:准备两块磁盘,一块在serv

织梦数据库备份还原

[功能描述]系统数据库备份还原.[操作说明]后台登陆-系统-数据库备份/还原.[应用实例]进入数据库备份还原操作界面备份:这里可以全选或选择部分表进行备份,指定备份数据格式我们一般为默认,分卷大小一般为2048,备份表结构信息默认打勾,如只需要备份数据时,可以不选择.我们点击提交按钮.这里显示备份进度,备份完成后会提示“完成所有数据备份”!我们可以点击数据还原进行查看.恢复:进入备份还原操作界面,点击数据还原,出现我们备份的数据信息这里我们同样可以还原某一个表或全部,我们点开始还原数据.这时还原

MSSQL2008数据库备份还原和数据恢复

原文:MSSQL2008数据库备份还原和数据恢复   序言 一直想写一篇关于数据库备份与恢复的文章,但基于能力的有限对数据库认知的有限怕不足以准确的表达,最后思考很久还是决定把自己的一些理解写出来供大家参考,也是为了回报自己:出于能力及语言表达能力的有限还望大家包含,如果里面有说的不对的地方还望大家及时提出.好及时修改不至于错误的引导他人. 认识数据库备份和事务日志备份 数据库备份与日志备份是数据库维护的日常工作,备份的目的是在于当数据库出现故障或者遭到破坏时可以根据备份的数据库及事务日志文件还