SQL Server ->> GROUPING SETS, CUBE, ROLLUP, GROUPING, GROUPING_ID

在我们制作报表的时候常常需要分组聚合、多组聚合和总合。如果通过另外的T-SQL语句来聚合难免性能太差。如果通过报表工具的聚合功能虽说比使用额外的T-SQL语句性能上要好很多,不过不够干脆,还是需要先生成整个结果集然后再聚合,而且最最重要的时很多情况下报表的聚合功能可能没办法达到我们需要的效果。GROUPING SETS, CUBE, ROLLUP, GROUPING, GROUPING_ID这几个聚合函数的作用就是在原始语句的基础上完成很多像财务报表需要的聚合功能。

GROUPING SETS相当于把多个GROUP BY语句通过UNION ALL

WITH T AS (
SELECT ‘A‘ A, ‘A‘ B UNION ALL
SELECT ‘A‘ A, ‘B‘ B UNION ALL
SELECT ‘A‘ A, ‘C‘ B UNION ALL
SELECT ‘B‘ A, ‘A‘ B UNION ALL
SELECT ‘B‘ A, ‘B‘ B UNION ALL
SELECT ‘B‘ A, ‘C‘ B UNION ALL
SELECT ‘C‘ A, ‘A‘ B UNION ALL
SELECT ‘C‘ A, ‘B‘ B UNION ALL
SELECT ‘C‘ A, ‘C‘ B)

SELECT  A, B,
        COUNT(A) AS CNT,
        GROUPING_ID(A,B)
FROM T
GROUP BY GROUPING SETS(A, B, ());

上面代码输出的结果

通常GROUPING SETS会配合GROUPING_ID或GROUPING函数来完成列的输出,比如聚合列的标签内容。

GROUPING_ID (a, b, c)  = GROUPING(a) + GROUPING(b) + GROUPING(c)

GROUPING 用于区分标准空值和由 ROLLUP、CUBE 或 GROUPING SETS 返回的空值。 作为 ROLLUP、CUBE 或 GROUPING SETS 操作结果返回的 NULL 是 NULL 的特殊应用。 它在结果集内作为列的占位符,表示全体。其实意思就是如果列输出为NULL说明是聚合列,不为空就不是聚合列。一开始很难理解。

SELECT
    T.[Group]
    ,T.CountryRegionCode
    ,S.Name AS N‘Store‘
    ,(SELECT P.FirstName + ‘ ‘ + P.LastName
        FROM Person.Person AS P
        WHERE P.BusinessEntityID = H.SalesPersonID)
        AS N‘Sales Person‘
    ,SUM(TotalDue)AS N‘TotalSold‘
    ,CAST(GROUPING(T.[Group])AS char(1)) +
        CAST(GROUPING(T.CountryRegionCode)AS char(1)) +
        CAST(GROUPING(S.Name)AS char(1)) +
        CAST(GROUPING(H.SalesPersonID)AS char(1))
        AS N‘GROUPING base-2‘
    ,GROUPING_ID((T.[Group])
        ,(T.CountryRegionCode),(S.Name),(H.SalesPersonID)
        ) AS N‘GROUPING_ID‘
    ,CASE
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) = 15 THEN N‘Grand Total‘
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) = 14 THEN N‘SalesPerson Total‘
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) = 13 THEN N‘Store Total‘
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) = 12 THEN N‘Store SalesPerson Total‘
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) = 11 THEN N‘CountryRegionCode Total‘
        WHEN GROUPING_ID(
            (T.[Group]),(T.CountryRegionCode)
            ,(S.Name),(H.SalesPersonID)
            ) =  7 THEN N‘Group Total‘
        ELSE N‘Error‘
        END AS N‘Level‘
FROM Sales.Customer AS C
    INNER JOIN Sales.Store AS S
        ON C.StoreID  = S.BusinessEntityID
    INNER JOIN Sales.SalesTerritory AS T
        ON C.TerritoryID  = T.TerritoryID
    INNER JOIN Sales.SalesOrderHeader AS H
        ON C.CustomerID = H.CustomerID
GROUP BY GROUPING SETS ((S.Name,H.SalesPersonID)
    ,(H.SalesPersonID),(S.Name)
    ,(T.[Group]),(T.CountryRegionCode),()
    )
--HAVING GROUPING_ID(
--    (T.[Group]),(T.CountryRegionCode),(S.Name),(H.SalesPersonID)
--    ) = @GroupingLevel
ORDER BY
    GROUPING_ID(S.Name,H.SalesPersonID),GROUPING_ID((T.[Group])
    ,(T.CountryRegionCode)
    ,(S.Name)
    ,(H.SalesPersonID))ASC;

上面代码来自MSDN的例子,数据库是示例数据库--AdventureWork2012

在只有一列作为GROUP BY CUBE/ROLLUP的列的情况下,两个函数是一样的效果。

CUBE和ROLLUP的区别就是CUBE比ROLLUP多输出多列的情况下,CUBE比ROLLUP多做的事情就是针对后面列的单独聚合行输出。

WITH T AS (
SELECT ‘A‘ A, ‘A‘ B UNION ALL
SELECT ‘A‘ A, ‘B‘ B UNION ALL
SELECT ‘A‘ A, ‘C‘ B UNION ALL
SELECT ‘B‘ A, ‘A‘ B UNION ALL
SELECT ‘B‘ A, ‘B‘ B UNION ALL
SELECT ‘B‘ A, ‘C‘ B UNION ALL
SELECT ‘C‘ A, ‘A‘ B UNION ALL
SELECT ‘C‘ A, ‘B‘ B UNION ALL
SELECT ‘C‘ A, ‘C‘ B)

SELECT  A, B,
        COUNT(A) AS CNT,
        GROUPING_ID(A,B)
FROM T
GROUP BY CUBE(A, B);

WITH T AS (
SELECT ‘A‘ A, ‘A‘ B UNION ALL
SELECT ‘A‘ A, ‘B‘ B UNION ALL
SELECT ‘A‘ A, ‘C‘ B UNION ALL
SELECT ‘B‘ A, ‘A‘ B UNION ALL
SELECT ‘B‘ A, ‘B‘ B UNION ALL
SELECT ‘B‘ A, ‘C‘ B UNION ALL
SELECT ‘C‘ A, ‘A‘ B UNION ALL
SELECT ‘C‘ A, ‘B‘ B UNION ALL
SELECT ‘C‘ A, ‘C‘ B)

SELECT  A, B,
        COUNT(A) AS CNT,
        GROUPING_ID(A,B)
FROM T
GROUP BY ROLLUP(A, B);
时间: 2024-10-21 17:55:39

SQL Server ->> GROUPING SETS, CUBE, ROLLUP, GROUPING, GROUPING_ID的相关文章

grouping sets,cube,rollup,grouping__id,group by

例1: hive -e" select type ,status ,count(1) from usr_info where pt='2015-09-14' group by type,status grouping sets ((type,status),( type),()); ">one.txt Grouping sets按照各种指定聚类汇总方式,如group by type,status grouping sets ((type,status),( type),()) 表

SQL Server 之 GROUP BY、GROUPING SETS、ROLLUP、CUBE

原文:SQL Server 之 GROUP BY.GROUPING SETS.ROLLUP.CUBE 1.创建表 Staff CREATE TABLE [dbo].[Staff]( [ID] [int] IDENTITY(1,1) NOT NULL, [Name] [varchar](50) NULL, [Sex] [varchar](50) NULL, [Department] [varchar](50) NULL, [Money] [int] NULL, [CreateDate] [date

转:GROUPING SETS、ROLLUP、CUBE

转:http://blog.csdn.net/shangboerds/article/details/5193211 大家对GROUP BY应该比较熟悉,如果你感觉自己并不完全理解GROUP BY,那么本文不适合你.还记得当初学习SQL的时候,总是理解不了GROUP BY的作用,经过好长时间才终于明白GROUP BY的真谛.当然,这和我本人笨也有关系,但是GROUP BY的确不好理解.本文将介绍DB2 GROUPING SETS.ROLLUP.CUBE的使用方法,这些关键字比GROUP BY更难

Grouping Sets:CUBE和ROLLUP从句

在上一篇文章里我讨论了SQL Server里Grouping Sets的功能.从文中的例子可以看到,通过简单定义需要的分组集是很容易进行各自分组.但如果像从所给的列集里想要有所有可能的分布——即所谓的幂集(Power Set),要怎么做呢? 当然,你可以用grouping set的语法功能来手动生成幂集,但那需要写一大堆的代码.因此今天我向你展示下grouping set功能支持的2个从句:CUBE和ROLLUP从句. CUBE从句 使用CUBE从句,对于提供的列集,你可以生成所有可能的分组集.

Group By 多个分组集小结 --GROUPING SETS,GROUP BY CUBE,GROUP BY ROLLUP,GROUPING(),GROUPING_ID()

T-SQL 多个分组集共有三种 GROUPING SETS, CUBE, 以及ROLLUP, 其中 CUBE和ROLLUP可以当做是GROUPING SETS的简写版 示例数据库下载: http://files.cnblogs.com/files/haseo/TSQL2012.rar GROUPING SETS 列出所有你设置的分组集 SELECT shipperid, YEAR(shippeddate) AS shipyear, COUNT(*) AS numorders FROM Sales

SQL Server里Grouping Sets的威力

在SQL Server里,你有没有想进行跨越多个列/纬度的聚集操作,不使用SSAS许可(SQL Server分析服务).我不是说在生产里使用开发版,也不是说安装盗版SQL Server. 不可能的任务?未必,因为通过SQL Server里所谓的Grouping Sets就可以.在这篇文章里我会给你概括介绍下Grouping Sets,使用它们可以实现哪类查询,什么是它们的性能优势. 使用Grouping Sets的聚合 假设你有个订单表,你想进行跨多个分组的T-SQL聚集查询.在Adventur

TSql Grouping Sets

TSql Group by clause主要有4种类型: Group by a,b group by rollup(a,b) group by cube(a,b) group by grouping sets((),(a),(a,b),rollup(a,b),cube(a,b)) rollup 和cube的作用是预定义grouping sets(分组集),rollup(a,b) 预定义的分组集是(),(a),(a,b);cube(a,b)预定义的的分组集是(),(a),(b),(a,b). gr

TSQL 分组集(Grouping Sets)

分组集(Grouping Sets)是多个分组的并集,用于在一个查询中,按照不同的分组列对集合进行聚合运算,等价于对单个分组使用“union all”,计算多个结果集的并集.使用分组集的聚合查询,返回的select 子句相同,由于select子句只能引用分组列,因此,在单个分组中缺失的分组列,TSQL返回NULL值. TSQL使用 group by 子句分组,有4种不同的语法: group by a,b group by rollup(a,b) group by cube(a,b) group

SQL Server 2008中增强的汇总技巧

SQL Server 2008中增强的汇总技巧 SQL Server 2008中SQL应用系列--目录索引 SQL Server 2008中对汇总有明显的增强,有点像Oracle的语法了.请看下面五个例子: 假定场景如下:某几位员工在不同时间参加了不同的项目,获取了相应的收入,现在需要按各种分类进行统计. 基本表如下: USE testDb2 GOIF NOT OBJECT_ID('tb_Income') IS NULL DROP TABLE [tb_Income]/****** Object: