SQL Server 之 GROUP BY、GROUPING SETS、ROLLUP、CUBE

原文:SQL Server 之 GROUP BY、GROUPING SETS、ROLLUP、CUBE

1.创建表 Staff

CREATE TABLE [dbo].[Staff](
    [ID] [int] IDENTITY(1,1) NOT NULL,
    [Name] [varchar](50) NULL,
    [Sex] [varchar](50) NULL,
    [Department] [varchar](50) NULL,
    [Money] [int] NULL,
    [CreateDate] [datetime] NULL
) ON [PRIMARY]

GO

2.为Staff表填充数据

INSERT INTO [dbo].[Staff]([Name],[Sex],[Department],[Money],[CreateDate])
SELECT ‘Name1‘,‘男‘,‘技术部‘,3000,‘2011-11-12‘
UNION ALL
SELECT ‘Name2‘,‘男‘,‘工程部‘,4000,‘2013-11-12‘
UNION ALL
SELECT ‘Name3‘,‘女‘,‘工程部‘,3000,‘2013-11-12‘
UNION ALL
SELECT ‘Name4‘,‘女‘,‘技术部‘,5000,‘2012-11-12‘
UNION ALL
SELECT ‘Name5‘,‘女‘,‘技术部‘,6000,‘2011-11-12‘
UNION ALL
SELECT ‘Name6‘,‘女‘,‘技术部‘,4000,‘2013-11-12‘
UNION ALL
SELECT ‘Name7‘,‘女‘,‘技术部‘,5000,‘2012-11-12‘
UNION ALL
SELECT ‘Name8‘,‘男‘,‘工程部‘,3000,‘2012-11-12‘
UNION ALL
SELECT ‘Name9‘,‘男‘,‘工程部‘,6000,‘2011-11-12‘
UNION ALL
SELECT ‘Name10‘,‘男‘,‘工程部‘,3000,‘2011-11-12‘
UNION ALL
SELECT ‘Name11‘,‘男‘,‘技术部‘,3000,‘2011-11-12‘

GROUP BY 分组查询, 一般和聚合函数配合使用

SELECT  [DEPARTMENT],SEX, COUNT(1)
FROM DBO.[STAFF]
GROUP BY SEX, [DEPARTMENT]

该段SQL是用于查询某个部门下的男女员工数量其数据结果如下

开销比较大

GROUPING SETS

使用 GROUPING SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高，SQL Server 2008引入。

1.使用GROUP BY 子句的 UNION ALL 来统计 Staff 表中的性别、部门、薪资、入职年份

SET STATISTICS IO ON
SET STATISTICS TIME ON

SELECT N‘总人数‘ ,‘‘,COUNT(0) FROM [DBO].[STAFF]
UNION ALL
SELECT N‘按性别划分‘, SEX,COUNT(0) FROM  [DBO].[STAFF] GROUP BY SEX
UNION ALL
SELECT N‘按部门统计‘,[DEPARTMENT],COUNT(0) FROM  [DBO].[STAFF] GROUP BY [DEPARTMENT]
UNION ALL
SELECT N‘按薪资统计‘,CONVERT(VARCHAR(10),[MONEY]),COUNT(0) FROM  [DBO].[STAFF] GROUP BY  [MONEY]
UNION ALL
SELECT N‘按入职年份‘,CONVERT(VARCHAR(10),YEAR([CREATEDATE])),COUNT(0) FROM  [DBO].[STAFF] GROUP BY YEAR([CREATEDATE])

2.换成GROUPING SETS的写法

SET STATISTICS IO ON
SET STATISTICS TIME ON
GO
SELECT (CASE
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=15 THEN N‘总人数‘
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=7 THEN N‘按性别划分‘
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=11 THEN N‘按部门统计‘
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=13 THEN N‘按薪资统计‘
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=14 THEN N‘按入职年份‘
END
),
(CASE
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=15 THEN ‘‘
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=7 THEN SEX
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=11 THEN [DEPARTMENT]
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=13 THEN CONVERT(VARCHAR(10),[MONEY])
WHEN GROUPING_ID(SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]))=14 THEN CONVERT(VARCHAR(10),YEAR([CREATEDATE]))
END
)
,
COUNT(1)
FROM DBO.[STAFF]
GROUP BY GROUPING SETS (SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]),())

从上述结果中可以看出,采用UNION ALL 是多次扫描表，并将扫描后的查询结果进行组合操作，会增加IO开销，减少CPU和内存开销。

采用GROUPING SETS 是一次性读取所有数据，并在内存中进行聚合操作生成结果，减少IO开销，对CPU和内存消耗增加。但GROUPING SETS 在多列分组时，其性能会比group by高。

这里扫描四次是因为我 GROUP BY GROUPING SETS (SEX,[DEPARTMENT],[MONEY],YEAR([CREATEDATE]),()) 了四列

ROLLUP与CUBE

ROLLUP与CUBE 按一定的规则产生多种分组，然后按各种分组统计数据

ROLLUP与CUBE 区别：

　　CUBE 会对所有的分组字段进行统计,然后合计。

　　ROLLUP 按照分组顺序，对第一个字段进行组内统计，最后给出合计。

下面看我查询

SELECT
      CASE WHEN (GROUPING(SEX) = 1) THEN ‘统计-ROLLUP‘
            ELSE ISNULL(SEX, ‘UNKNOWN‘)
       END AS SEX ,
        COUNT(0)
FROM DBO.[STAFF]
GROUP BY   SEX   WITH ROLLUP

SELECT
      CASE WHEN (GROUPING(SEX) = 1) THEN ‘统计-CUBE‘
            ELSE ISNULL(SEX, ‘UNKNOWN‘)
       END AS SEX ,
        COUNT(0)
FROM DBO.[STAFF]
GROUP BY   SEX   WITH CUBE

看不出差别，我们再加一列

SELECT
      CASE WHEN (GROUPING(SEX) = 1) THEN ‘统计-ROLLUP‘
            ELSE ISNULL(SEX, ‘UNKNOWN‘)
       END AS SEX ,
      CASE WHEN (GROUPING([DEPARTMENT]) = 1) THEN ‘统计-ROLLUP‘
            ELSE ISNULL([DEPARTMENT], ‘UNKNOWN‘)
       END AS [DEPARTMENT],
        COUNT(0)
FROM DBO.[STAFF]
GROUP BY   SEX,[DEPARTMENT]   WITH ROLLUP

SELECT
      CASE WHEN (GROUPING(SEX) = 1) THEN ‘统计-CUBE‘
            ELSE ISNULL(SEX, ‘UNKNOWN‘)
       END AS SEX ,
      CASE WHEN (GROUPING([DEPARTMENT]) = 1) THEN  ‘统计-CUBE‘
            ELSE ISNULL([DEPARTMENT], ‘UNKNOWN‘)
       END AS [DEPARTMENT],
        COUNT(0)
FROM DBO.[STAFF]
GROUP BY   SEX,[DEPARTMENT]  WITH CUBE

可以看出使用 ROLLUP 会先统计分组下的，然后在对GROUP BY的第一列字段进行统计，最后计算总数，而 CUBE 则是先分组统计，然后统计GRUOP BY 的每个字段，最后进行汇总。

http://www.cnblogs.com/woxpp/p/4688715.html

时间： 2024-08-26 11:49:22

SQL Server 之 GROUP BY、GROUPING SETS、ROLLUP、CUBE的相关文章

T-Sql语法：GROUP BY子句GROUPING SETS、CUBE、ROLLUP

#cnblogs_post_body h1 { background-color: #A5A5A5; color: white; padding: 5px } GROUP BY子句 1.ROLLUP() 生成某一维度的分组的小计行,还生成一个总计行. 示例表: select * from student 我们来看一下具体示例: select sex,sclass,sum(score) from student group by rollup(sex,sclass) 如图中所示,ROLLUP()为

GROUPING SETS、CUBE、ROLLUP

其实还是写一个Demo 比较好 USE tempdb IF OBJECT_ID( 'dbo.T1' , 'U' )IS NOT NULL BEGIN DROP TABLE dbo.T1; END; GO CREATE TABLE dbo.T1 ( id INT , productName VARCHAR(200) , price MONEY , num INT , amount INT , operatedate DATETIME ) GO DECLARE @i INT DECLARE @ran

SQL server 关于 GROUP BY 详细讲解和用法

1. Group By 语句简介: Group By语句从英文的字面意义上理解就是"根据(by)一定的规则进行分组(Group)".它的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理. P.S. 这里真是体会到了一个好的命名的力量,Group By从字面是直接去理解是非常好理解的.恩,以后在命名的环节一定要加把劲:).话题扯远了. 2. Group By 的使用: 上面已经给出了对Group By语句的理解.基于这个理解和SQL Server 2

Hive分析窗口函数(五) GROUPING SETS,GROUPING__ID,CUBE,ROLLUP

1.GROUPING SETS与另外哪种方式等价? 2.根据GROUP BY的维度的所有组合进行聚合由哪个关键字完成? 3.ROLLUP与ROLLUP关系是什么? GROUPING SETS,GROUPING__ID,CUBE,ROLLUP 这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时.天.月的UV数. Hive版本为 apache-hive-0.13.1 数据准备: 2015-03,2015-03-10,cookie1 2015-03,20

hive grouping sets 和 cube 用法

grouping sets 和cube基本知识. 基础知识可参考 http://blog.csdn.net/mashroomxl/article/details/22578471 grouping sets 适用于多维度统计,可以代替之前lateral view explode 方式 cube 相当于grouping sets 所有条件组合. 平时跑临时需求看数据,也可以用cube.比如看某款游戏android,ios,_NONE的数量,很方便可以用一个sql写. grouping sets 与

SQL Server2008 程序设计汇总 GROUP BY，WITH ROLLUP，WITH CUBE，GROUPING SETS(..)

--SQL Server2008 程序设计汇总 GROUP BY ,WITH ROLLUP WITH CUBE GROUPING SET(..) /******************************************************************************** *主题:SQL Server2008 程序设计汇总 group by ,WITH ROLLUP WITH CUBE *说明:本文是个人学习的一些笔记和个人愚见 * 有很多

SQL Server里Grouping Sets的威力

在SQL Server里,你有没有想进行跨越多个列/纬度的聚集操作,不使用SSAS许可(SQL Server分析服务).我不是说在生产里使用开发版,也不是说安装盗版SQL Server. 不可能的任务?未必,因为通过SQL Server里所谓的Grouping Sets就可以.在这篇文章里我会给你概括介绍下Grouping Sets,使用它们可以实现哪类查询,什么是它们的性能优势. 使用Grouping Sets的聚合假设你有个订单表,你想进行跨多个分组的T-SQL聚集查询.在Adventur

Grouping Sets:CUBE和ROLLUP从句

在上一篇文章里我讨论了SQL Server里Grouping Sets的功能.从文中的例子可以看到,通过简单定义需要的分组集是很容易进行各自分组.但如果像从所给的列集里想要有所有可能的分布——即所谓的幂集(Power Set),要怎么做呢? 当然,你可以用grouping set的语法功能来手动生成幂集,但那需要写一大堆的代码.因此今天我向你展示下grouping set功能支持的2个从句:CUBE和ROLLUP从句. CUBE从句使用CUBE从句,对于提供的列集,你可以生成所有可能的分组集.

TSql Grouping Sets

TSql Group by clause主要有4种类型: Group by a,b group by rollup(a,b) group by cube(a,b) group by grouping sets((),(a),(a,b),rollup(a,b),cube(a,b)) rollup 和cube的作用是预定义grouping sets(分组集),rollup(a,b) 预定义的分组集是(),(a),(a,b);cube(a,b)预定义的的分组集是(),(a),(b),(a,b). gr