快速回顾MySQL:汇总和分组

10.3 汇总数据

我们经常需要汇总数据而不用把它们实际检索处出来,为此MySQL提供了专门的函数。使用这些函数,MySQL查询可用于检索数据,以便分析和报表的生成。这种类型的检索例子有以下几种:

  • 确定表中的行数(或者满足某个条件或包含某个特定值的行数)。
  • 获得表中行组的和。
  • 找出表列(或所有行或某些特定的行)的最大值、最小值和平均值。

上述的例子都需要对表中数据(而不是实际数据本身)汇总。因此,返回实际表数据是对时间和处理资源的一种浪费(更不用说带宽了)。

MySQL提供了5个聚集函数。

聚集函数(aggregate function)运行在行组上,计算和返回单个值的函数。

函数 说明
AVG() 返回某列的平均值
COUNT() 返回某列的行数
MAX() 返回某列的最大值
MIN() 返回某列的最小值
SUM() 返回某列值之和

下面简单介绍这些函数

先创建下面的表:

CREATE TABLE student(
    sid INT PRIMARY KEY,
    sname VARCHAR(20),
    ssex  CAHR(1)
);
CREATE TABLE score(
    sid INT PRIMARY KEY,
    sname VARCHAR(20),
    smath INT,
    senglish INT
);

10.3.1 AVG()函数

AVG()通过对表中行数计数并计算特定列值之和,求得该列的平均值。AVG()可用来返回所有列的平均值,也可以用来返回特定列平均值。

AVG()只能用来确定特定数值列的平均值,而且列名必须作为函数参数给出。为了获得多个列的平均值,必须使用多个AVG()函数。
AVG()函数忽略列值为NULL的行。

来使用AVG()函数来查询成绩表score中数学成绩的平均分(自己随便加上几个数):

SELECT AVG(smath) AS avg_smath FROM score;

AVG()也可用用来确定特定列平均值,配合WHERE子句。

10.3.2 COUNT()函数

COUNT()函数确定表中行的数目或符合特定条件的行的数目。

COUNT()函数有两种使用的方式:

  • 使用COUNT(*)对表中行的数目进行计数,不管表列中包含的是空值(NULL)还是非空值。
  • 使用COUNT(column)对特定列中具有值的行进行计数,忽略NULL值。

比如:返回学生总数:

SELECT COUNT(*) FROM student;

返回女生总数(特定列):

SELECT COUNT(ssex) FROM student WHERE ssex='女';

如果指定列名,则指定列的值为空的行被COUNT()函数忽略,但如果COUNT()函数中用的是星号(*),则不忽略。

10.3.3 MAX()函数

MAX() 返回指定列中的最大值。MAX() 要求指定列名。

比如:返回成绩表中数学成绩的最高分:

SELECT MAX(smath) FROM score;

虽然MAX()一般用来找出最大的数值或日期值,但MySQL允许将它用来返回任意列中的最大值,包括返回文本列中的最大值。在用于文本数据时,如果数据按相应的列排序,则MAX()返回最后一行。MIN()函数也是,但是相反,返回最前面的行。

MAX()、MIN()都是忽略列值为NULL的行。

10.3.4 MIN()函数

MIN() 返回指定列中的最小值。MIN() 要求指定列名。

比如:返回成绩表中数学成绩的最低分:

SELECT MIN(smath) FROM score;

10.3.5 SUM()函数

SUM()用来返回指定列值的和(总计)。

比如返回一个班中的数学成绩的总分:

SELECT SUM(smath) FROM score;

利用标准的算术操作符,所有的聚集函数都可以用来执行多个列上的计算。

SUM()函数忽略列值为NULL的行。

10.3.6 聚集不同值

以上5个聚集函数都可以如下使用:

  • 对所有的行执行计算,指定参数或不给参数(MAX和MIN函数);
  • 只包含不同的值,指定DISTINCT参数。(去重)

下面举例指定DISTINCT参数的用法:比如成绩表中数学成绩的平均分,平均分只考虑各个不同的分数:

SELECT AVG(DISTINCT smath) AS avg_smath FROM score;

如果指定列名,则DISTINCT只能用于COUNT(),DISTINCT不能用于COUNT(*),因此不允许使用COUNT(DISTINCT),否则会产生错误。类似地,DISTINCT必须使用列名,不能用于计算或表达式。

DISTINCT可用于MAX()和MIN(),但是没有意义。

10.3.7 组合聚集函数

实际上SELECT语句可根据需要包含多个聚集函数

使用聚集函数,最好使用别名。



小结:聚集函数用来汇总数据,这些函数都是高效设计,它们返回的结果一般比你在自己的客户机应用程序中计算要快得多。

10.4 分组数据

前面已经学习了SQL聚集函数来汇总数据。但是,比如:要求出学生表中男生和女生各有多少人。可用使用两条语句分别打印。下面介绍另一种方式:分组。

分组:把数据分为多个逻辑组,以便能对每个组进行聚集计算。

10.4.1 创建分组

分组时在SELECT语句的GROUP BY子句中建立的。按照上面的例子,对学生表的男女生分组:

SELECT ssex, COUNT(ssex) AS total FROM student GROUP BY ssex;

输出:

+---------+----------------+
| stu_sex |      total     |
+---------+----------------+
| 女      |              6 |
| 男      |             11 |
+---------+----------------+
3 rows in set (0.05 sec)

但是也可这样使用:

SELECT ssex, COUNT(*) AS total FROM student GROUP BY ssex;

输出结果同上。

为什么会这样??因为使用了GROUP BY,就不必指定要计算和估值得每个组了。系统会自动完成。GROUP BY子句指示MySQL分组数据,然后对每个组而不是整个结果集进行聚集。

在具体使用GROUP BY子句前,需要知道一些重要的规定:

  • GROUP BY子句可以包括任意数目的列。这使得能对分组进行嵌套,为数据分组提供更细致的控制。
  • 如果在GROUP BY子句中嵌套了分组,数据将在最后规定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。
  • GROUP BY子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。
  • 除聚集计算语句外,SELECT语句中的每个列都必须在GROUP BY子句中给出。
  • 如果分组列中具有NULL值,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。
  • GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。

使用WITH ROLLUP关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值
比如:

SELECT ssex, COUNT(*) AS total
FROM student
GROUP BY ssex WITH ROLLUP;

输出:

+---------+-------+
| stu_sex | total |
+---------+-------+
| 女      |    10 |
| 男      |    16 |
| NULL    |    26 |
+---------+-------+
3 rows in set (0.05 sec)

引入一个函数:IFNULL(expression, alt_value):IFNULL() 函数用于判断第一个表达式是否为 NULL,如果为 NULL 则返回第二个参数的值,如果不为 NULL 则返回第一个参数的值。

SELECT IFNULL(ssex,'总计')  AS ssex, COUNT(*) AS total
FROM student
GROUP BY ssex WITH ROLLUP;

输出:

+---------+-------+
| stu_sex | total |
+---------+-------+
| 女      |    10 |
| 男      |    16 |
| 总计    |    26 |
+---------+-------+
3 rows in set (0.05 sec)

10.4.2 过滤分组

MySQL允许过滤分组,规定包括哪些分组,排除哪些分组。但是WHERE子句过滤指定的是行而不是分组。所以MySQL提供了HAVING子句,HAVING子句类似于WHERE,至今为止的所有类型的WHERE子句都可以用HAVING子句来替代。唯一的差别是WHERE子句过滤行,而HAVING子句过滤分组(即是先分组再过滤)

比如:显示学生表的男生或者女生人数大于15个的。

SELECT ssex, COUNT(*) AS total
FROM student
GROUP BY ssex HAVING COUNT(*)>=15;

注意:HAVING子句在GROUP BY之后,因为是对分组的结果进行过滤。而WHERE子句是对行进行过滤,所以必须在GROUP BY之前。所以WHERE子句过滤的行可能会影响到GROUP BY的分组结果

那么可以同时使用WHERE子句和HAVING子句吗??答案是可以的。

10.4.3 分组和排序

说一说排序(ORDER BY)和分组(GROUP BY)的区别:

排序 分组
排序产生的输出 输出可能不是分组的顺序
任意列都可以使用(甚至非选择的列也可以使用) 只能使用选择列或表达式列,而且必须使用每个选择列表达式
不一定需要 如果与聚集函数一起使用列(或表达式),则必须使用

上面表格的第一行,可以经常发现GROUP BY分组的数据确实是以分组顺序输出的,但情况并不总这样,它并不是SQL规范所要求的。此外,用户可能会要求以不同于分组的顺序排序。仅因为你以某种方式分组数据,并不表示你需要以相同的方式排序输出。应该提供明确的BRDER BY子句,即使其效果等同于GROUP BY子句的输出结果。

所以一般使用GROUP BY子句最好跟上ORDER BY子句。

那么在位置如何放置:ORDER BY子句一定是放在sQL语句最后的。

所以修改上面的语句:例子举得不是很好,就看看怎么写。

SELECT ssex, COUNT(*) AS total
FROM student
GROUP BY ssex
HAVING COUNT(*)>=15
ORDER BY ssex;


小结:学习了如何用SQL聚集函数对数据进行汇总计算。也介绍如何使用GROUP UP子句对数据组进行这些汇总金酸,返回每个组的结果。而且还学了HAVING子句过滤特定的组,WHERE和HAVING之间以及ORDER BY和GROUP BY之间的差异

原文地址:https://www.cnblogs.com/flunggg/p/12203639.html

时间: 2024-08-29 13:52:07

快速回顾MySQL:汇总和分组的相关文章

快速学习MySQL SQL语句

须知: SQL语言:结构化查询语言,是关系型数据库查询语言的标准,不同的数据库虽然有自己私有扩展,但关键词都支持:(select.update.delete.insert.where) SQL语句分类:像Oracle.MSSQL都是通用的 DDL:数据定义语言(create.alter.drop.rename) DML:数据库维护语言(select.insert.update.delete) DCL:数据库控制语言,权限(Grant.revoke) TCL:事物型语言(commt.sarepqi

数据结构快速回顾——图的遍历

图的遍历指的是从图中的任一顶点出发,对图中的所有顶点访问一次且只访问一次.图的遍历操作和树的遍历操作功能相似.图的遍历是图的一种基本操作,图的许多其它操作都是建立在遍历操作的基础之上. 图的遍历方法目前有深度优先搜索法和广度(宽度)优先搜索法两种算法. 深度优先搜索法DFS 深度优先搜索法的基本思想是:从图G的某个顶点v0出发,访问v0,然后选择一个与v0相邻且没被访问过的顶点vi访问,再从vi出发选择一个与vi相邻且未被访问的顶点vj进行访问,依次继续.如果当前被访问过的顶点的所有邻接顶点都已

数据结构快速回顾——栈

堆栈,也可直接称栈,是一种特殊的串行形式的数据结构,它的特殊之处在于只能允许在链结串行或阵列的一端进行加入资料和输出资料的运算.另外堆栈也可以用一维阵列或连结串行的形式来完成. 1 #define STACK_INIT_SIZE 100 2 #define STACKINCREMENT 10 3 4 typedef struct 5 { int* top; 6 int* base; 7 int stacksize; 8 }SqStack; 9 10 int InitStack(SqStack &

Percona Xtrabackup快速备份MySQL

Percona Xtrabackup快速备份MySQL 提交 我的评论 加载中 已评论 Percona Xtrabackup快速备份MySQL 2015-07-10 Linux中国 Linux中国 Linux中国 微信号 linux-cn 功能介绍 面向Linux爱好者,提供Linux技术文章.新闻资讯和交流平台. 每天推送一条最新精选Linux资讯和技术文章:支持Linux命令查询.Linux资讯搜索及微信群的交流. 老规矩,开场白,刚开始用mysqldump,备份100G+的数据库,再加上服

数据结构快速回顾——二叉树 解幂子集问题

回溯法是设计递归的一种常用方法,它的求解过程实质上就是一个先序遍历一棵"状态树"的过程,只是这棵树不是遍历前预先建立的而是隐含在遍历过程中的. 下面举一个例子:求含n个元素的集的幂集:集合A={ {1,2,3}, {1,2}, {1,3}, {1}, {2,3},{2},{3},{}}; //{}表示空集合从集合A的每一个元素的角度看,它只有两种状态:或者是属于幂集的元素集,或不属于幂集元素集,则求幂集的过程就可以看成是依次对集合A中的元素进行"取","舍

数据结构快速回顾——二叉树

二叉树(Binary Tree)是个有限元素的集合,该集合或者为空.或者由一个称为根(root)的元素及两个不相交的.被分别称为左子树和右子树的二叉树组成.当集合为空时,称该二叉树为空二叉树.在二叉树中,一个元素也称作一个结点. 基本概念: (1)结点的度.结点所拥有的子树的个数称为该结点的度. (2)叶结点.度为0的结点称为叶结点,或者称为终端结点. (3)分枝结点.度不为0的结点称为分支结点,或者称为非终端结点.一棵树的结点除叶结点外,其余的都是分支结点. (4)左孩子.右孩子.双亲.树中一

MySQL汇总数据

汇总数据 有时对数据表的操作不是表中数据本身,而是表中数据的汇总,例如 某一列数据的平均值,最大值,最小值等.而对于这些常用的数据汇总处理,MySQL提供了函数来处理. SQL聚集函数 函数 说明 COUNT() 返回某列的行数 MAX() 返回某列最大值 MIN() 返回某列最小值 AVG() 返回某列平均值 SUM() 返回某列值之和 例子: 首先显示出products表格如下: 求出prod_price列的平均值 看起来比较怪,原表只显示了一行: 求出特定行的 如vend_id =1003

算法快速回顾——排序算法

常用排序算法有以下几种:冒泡排序.插入排序.快速排序.归并排序.堆排序. 本文将对五种常用算法分析并实现. //交换两个元素的值 这里列出几种不同写法 void swap(int *a, int *b) { int c = *a; *a = *b; *b = c; } void swap(int *a,int *b) { *a = (*a)^(*b); *b = (*b)^(*a); *a = (*a)^(*b); } void swap(int *a,int *b) { *a = *a + *

MySQL Study案例之--快速了解MySQL服务器

MySQL Study案例之--快速了解MySQL服务器 1.查看数据库版本 mysql> show variables like 'version'; +---------------+----------+ | Variable_name | Value    | +---------------+----------+ | version       | 5.6.4-m7 | +---------------+----------+ 1 row in set (0.00 sec) 2.查看