SQL Server表分区的NULL值问题

SQL Server表分区的NULL值问题

SQL Server表分区只支持range分区这一种类型,往往会被大家吐槽

人家MySQL支持四种类型:RANGE分区、LIST分区、HASH分区、KEY分区

共同点是MySQL跟SQL Server也有分区对齐的问题,都是水平切分,大家都允许分区列存在NULL值

这次我们测试SQL Server表分区的分区列的NULL值,究竟NULL值是被存放在哪个区间,以前一直没有注意

测试脚本

--1.创建文件组
ALTER DATABASE [sss]
ADD FILEGROUP [FG_TinyBlog_Id_01]

ALTER DATABASE [sss]
ADD FILEGROUP [FG_TinyBlog_Id_02]

ALTER DATABASE [sss]
ADD FILEGROUP [FG_TinyBlog_Id_03]

ALTER DATABASE [sss]
ADD FILEGROUP [FG_TinyBlog_Id_04]

ALTER DATABASE [sss]
ADD FILEGROUP [FG_TinyBlog_Id_05]

--2.创建文件
ALTER DATABASE [sss]
ADD FILE
(NAME = N‘FG_TinyBlog_Id_01_data‘,FILENAME = N‘E:\DataBase\sss\FG_TinyBlog_Id_01_data.ndf‘,SIZE = 96MB, FILEGROWTH = 24MB )
TO FILEGROUP [FG_TinyBlog_Id_01];

ALTER DATABASE [sss]
ADD FILE
(NAME = N‘FG_TinyBlog_Id_02_data‘,FILENAME = N‘E:\DataBase\sss\FG_TinyBlog_Id_02_data.ndf‘,SIZE = 96MB, FILEGROWTH = 24MB )
TO FILEGROUP [FG_TinyBlog_Id_02];

ALTER DATABASE [sss]
ADD FILE
(NAME = N‘FG_TinyBlog_Id_03_data‘,FILENAME = N‘E:\DataBase\sss\FG_TinyBlog_Id_03_data.ndf‘,SIZE = 96MB, FILEGROWTH = 24MB )
TO FILEGROUP [FG_TinyBlog_Id_03];

ALTER DATABASE [sss]
ADD FILE
(NAME = N‘FG_TinyBlog_Id_04_data‘,FILENAME = N‘E:\DataBase\sss\FG_TinyBlog_Id_04_data.ndf‘,SIZE = 96MB, FILEGROWTH = 24MB )
TO FILEGROUP [FG_TinyBlog_Id_04];

ALTER DATABASE [sss]
ADD FILE
(NAME = N‘FG_TinyBlog_Id_05_data‘,FILENAME = N‘E:\DataBase\sss\FG_TinyBlog_Id_05_data.ndf‘,SIZE = 96MB, FILEGROWTH = 24MB )
TO FILEGROUP [FG_TinyBlog_Id_05];

--3.创建分区函数
CREATE PARTITION FUNCTION
Fun_TinyBlog_Id(INT) AS
RANGE LEFT
FOR VALUES(-10,0,1,6)

--4.创建分区方案
CREATE PARTITION SCHEME
[Sch_TinyBlog_Id] AS
PARTITION [Fun_TinyBlog_Id]
TO([FG_TinyBlog_Id_01],[FG_TinyBlog_Id_02],[FG_TinyBlog_Id_03],[FG_TinyBlog_Id_04],[FG_TinyBlog_Id_05])

插入测试数据

USE [sss]

CREATE TABLE TinyBlog(id INT  NULL,NAME VARCHAR(100))
 ON [Sch_TinyBlog_Id](id)

SELECT * FROM TinyBlog ORDER BY id 

INSERT INTO [dbo].[TinyBlog]
        ( [id], [NAME] )
VALUES  ( NULL, -- id - int
          ‘3232‘  -- NAME - varchar(100)
          )

INSERT INTO [dbo].[TinyBlog]
        ( [id], [NAME] )
VALUES  ( -2, -- id - int
          ‘-2‘  -- NAME - varchar(100)
          )

INSERT INTO [dbo].[TinyBlog]
        ( [id], [NAME] )
VALUES  ( 66, -- id - int
          ‘66‘  -- NAME - varchar(100)
          )

INSERT INTO [dbo].[TinyBlog]
        ( [id], [NAME] )
VALUES  ( 0, -- id - int
          ‘0‘  -- NAME - varchar(100)
          )

INSERT INTO [dbo].[TinyBlog]
        ( [id], [NAME] )
VALUES  ( -30, -- id - int
          ‘-30‘  -- NAME - varchar(100)
          )

表数据如下

SELECT * FROM TinyBlog ORDER BY id 

分区分布

--查看分区架构文件组分布
SELECT  CONVERT(VARCHAR(MAX), ps.name) AS partition_scheme ,
        p.partition_number ,
        CONVERT(VARCHAR(MAX), ds2.name) AS filegroup ,
        CONVERT(VARCHAR(MAX), ISNULL(v.value, ‘‘), 120) AS range_boundary ,
        STR(p.rows, 9) AS rows
FROM    sys.indexes i
        JOIN sys.partition_schemes ps ON i.data_space_id = ps.data_space_id
        JOIN sys.destination_data_spaces dds ON ps.data_space_id = dds.partition_scheme_id
        JOIN sys.data_spaces ds2 ON dds.data_space_id = ds2.data_space_id
        JOIN sys.partitions p ON dds.destination_id = p.partition_number
                                 AND p.object_id = i.object_id
                                 AND p.index_id = i.index_id
        JOIN sys.partition_functions pf ON ps.function_id = pf.function_id
        LEFT JOIN sys.Partition_Range_values v ON pf.function_id = v.function_id
                                                  AND v.boundary_id = p.partition_number
                                                  - pf.boundary_value_on_right
WHERE   i.object_id = OBJECT_ID(‘TinyBlog‘)
        AND i.index_id IN ( 0, 1 )
ORDER BY p.partition_number

--分区区间
--SELECT  *  FROM    sys.partition_range_values

分区情况

--分区情况
SELECT  c.* ,
        b.[groupname] AS ‘分区方案对应的文件组名称‘ ,
        d.name ‘当前分区函数对应的分区方案‘
FROM    sys.destination_data_spaces AS a
        INNER JOIN sysfilegroups AS b ON a.[data_space_id] = b.[groupid]
        INNER JOIN ( SELECT $PARTITION.Fun_TinyBlog_Id(id) AS 分区编号 ,
                            MIN(id) AS Min_value ,
                            MAX(id) AS Max_value ,
                            COUNT(id) AS 记录数
                     FROM   [dbo].[TinyBlog]
                     GROUP BY $PARTITION.Fun_TinyBlog_Id(id)
                   ) AS c ON c.[分区编号] = a.[destination_id]
        INNER JOIN sys.partition_schemes AS d ON a.[partition_scheme_id] = d.data_space_id
ORDER BY c.[分区编号]

第二个视图直接把NULL值忽略了

根据第一个视图,我们画出一个总结图

分析一下



总结

结论其实很清晰,分区列不要允许NULL,如果允许列,那么我们交换分区归档数据的时候就会有麻烦了,因为无法判断分区列是NULL值的那些数据行是老数据还是新数据

相关文章:

http://www.cnblogs.com/gaizai/archive/2010/11/05/1870071.html

https://msdn.microsoft.com/zh-cn/library/ms187802.aspx

如有不对的地方,欢迎大家拍砖o(∩_∩)o 

时间: 2024-10-14 10:09:22

SQL Server表分区的NULL值问题的相关文章

SQL Server表分区详解

原文:SQL Server表分区详解 什么是表分区 一般情况下,我们建立数据库表时,表数据都存放在一个文件里. 但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在不同的磁盘下由多个cpu进行处理.这样文件的大小随着拆分而减小,还得到硬件系统的加强,自然对我们操作数据是大大有利的. 所以大数据量的数据表,对分区的需要还是必要的,因为它可以提高select效率,还可以对历史数据经行区分存档等.但是数据量少的数据就不要凑这个热

SQL Server表分区【转】

转自:http://www.cnblogs.com/knowledgesea/p/3696912.html SQL Server表分区 什么是表分区 一般情况下,我们建立数据库表时,表数据都存放在一个文件里. 但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在不同的磁盘下由多个cpu进行处理.这样文件的大小随着拆分而减小,还得到硬件系统的加强,自然对我们操作数据是大大有利的. 所以大数据量的数据表,对分区的需要还是必要的

SQL SERVER 表分区

一 .SQL SERVER 表分区介绍: SQL Server  引入的表分区技术,让用户能够把数据分散存放到不同的物理磁盘中,提高这些磁盘的并行处理性能以优化查询性能…… 二 .SQL SERVER 数据库表分区由三个步骤来完成: 1.创建分区函数 2.创建分区架构 3.对表进行分区 基于缓存更新机制,我使用时间来进行分区,这里大家根据业务的要求使用合适的字段来作为分区 创建数据库分区文件数量,这里存储一年的数据分成十二个分区,需要现在D盘建立好Data 的文件夹 里面包含Primary 文件

8、SQL Server 表分区

什么是表分区?表分区其实就是将一个大表分成若干个小表,可以将一些不需要经常操作的数据存在其他的表,然后想查询哪个表的记录,就去对应的表中查询,由于表中的记录变少了,查询的时间也就少了.表分区可以从物理上将一个大表分成几个小表,但是逻辑上还是一个表.所以当执行插入操作的时候,不需要我们去判断应该插入到哪个表中.只需要插入大表中就可以了.SQL Server会自动的将它放在对应的表中.对于查询也是一样,直接查询大表就可以了. 什么时候需要表分区?当数据量过百万时,访问速度明显变慢,并且你的数据是按某

SQL Server表分区

什么是表分区 一般情况下,我们建立数据库表时,表数据都存放在一个文件里. 但是如果是分区表的话,表数据就会按照你指定的规则分放到不同的文件里,把一个大的数据文件拆分为多个小文件,还可以把这些小文件放在不同的磁盘下由多个cpu进行处理.这样文件的大小随着拆分而减小,还得到硬件系统的加强,自然对我们操作数据是大大有利的. 所以大数据量的数据表,对分区的需要还是必要的,因为它可以提高select效率,还可以对历史数据经行区分存档等.但是数据量少的数据就不要凑这个热闹啦,因为表分区会对数据库产生不必要的

SQL Server 2008 分区函数和分区表详解

SQL Server 2008 分区函数和分区表详解 2012-10-28 20:06 来源:博客园 作者:zhijianliutang 字号:T|T [摘要]本文详细介绍SQL Server 2008 分区函数和分区表,包括查询某个分区.归档数据.添加分区.删除分区等内容. 当我们数据量比较大的时候,我们需要将大型表拆分为多个较小的表,则只访问部门数据的查询就可以更快的运行,基本原理就是,因为要扫描的数据变的更小.维护任务(例如,重新生成索引或备份表)也可以更快的运行. 我们可以再不通过将表物

深入浅出SQL Server 2008 分区函数和分区表

原文:深入浅出SQL Server 2008 分区函数和分区表 当我们数据量比较大的时候,我们需要将大型表拆分为多个较小的表,则只访问部门数据的查询就可以更快的运行,基本原理就是,因为要扫描的数据变的更小.维护任务(例如,重新生成索引或备份表)也可以更快的运行. 我们可以再不通过将表物理放置在多个磁盘驱动器上来拆分表的情况下获取分区.如果将某个表放置在一个物理驱动器上,将相关表放置在另一个驱动器上,则可以提高查询性能,因为当运行涉及表间连接的查询时,多个磁盘头同时读取数据.可以使用SQL Ser

在一个SQL Server表中的多个列找出最大值

在一个SQL Server表中一行的多个列找出最大值 有时候我们需要从多个相同的列里(这些列的数据类型相同)找出最大的那个值,并显示 这里给出一个例子 IF (OBJECT_ID('tempdb..##TestTable') IS NOT NULL) DROP TABLE ##TestTable CREATE TABLE ##TestTable ( ID INT IDENTITY(1,1) PRIMARY KEY, Name NVARCHAR(40), UpdateByApp1Date DATE

Oracle SQL篇(一)null值之初体验

    从我第一次正式的写sql语句到现在,已经超过10年的时间了.我写报表,做统计分析和财务对账,我一点点的接触oracle数据库,并尝试深入了解.这条路,一走就是10年,从充满热情,到开始厌倦,我不知道我还能坚持多久,未来的路,谁知道呢? 也许是该抓紧时间,做一点什么了,我不知道该开始写些什么,我从来没有在网上写东西的习惯.     先从简单的开始吧,那当然就是SQL,这是我SQL系列的第一篇,希望我能够坚持. 在Oracle数据库中,如果一个表中的列没有值的话,我们可以说是空值,比如IT员