聚合与分组

聚合函数的分类:
-COUNT: 统计行数量
-SUM: 获取某个单列的合计值
-AVG: 计算某个列的平均值
-MAX: 计算列的最大值
-MIN: 计算列的最小值

计数规范:
1、ALL:全部,默认,一般都用这个
count(*)统计所有行,包括NULL
select count(region) as‘地区总数‘ from bbc;
2、DISTINCT:去除重复的,而且是非空值
select count(distinct region) from bbc;
3、SUM,AVG
select sum(population)/count(population) from bbc where region = ‘Africa‘;
select avg(population)from bbc where region = ‘Africa‘;
4、MAX
select max(population)as‘最大人口‘from BBC;

分组:过滤分组数据
标准结构:select 列A,聚合函数(聚合函数规范)from表名 where 过滤条件 GROUP BY 列A;
在where条件过滤后分组(顺序:from where Group By select order By)
分组有效的条件:☆
1、使用了聚合函数的列,
或者
2、该列在Group BY子句中:
多列分组:只有多列都相等时,才分为一组;很容易遗忘;

HAVING子句:
当需要使用聚合函数 来过滤 查询结果集时使用HAVING 子句

HAVING 和 WHERE 的区别:
where先执行,后边不能用聚合函数,
having在分组之后执行,能使用聚合函数

时间: 2024-12-04 18:13:37

聚合与分组的相关文章

Python数据聚合和分组运算(1)-GroupBy Mechanics

前言 Python的pandas包提供的数据聚合与分组运算功能很强大,也很灵活.<Python for Data Analysis>这本书第9章详细的介绍了这方面的用法,但是有些细节不常用就容易忘记,遂打算把书中这部分内容总结在博客里,以便复习查看.根据书中的章节,这部分知识包括以下四部分: 1.GroupBy Mechanics(groupby技术) 2.Data Aggregation(数据聚合) 3.Group-wise Operation and Transformation(分组级运

运维 2.0 时代:数据聚合和分组

运维 2.0 时代:数据聚合和分组 from http://www.cnblogs.com/oneapm/p/4962111.html 运维 2.0 是指,从技术运维升级为服务运维,向公司提供可依赖的专业服务.运维 2.0 强调服务交付能力,而不是技术能力,需求可依赖.懂业务.服务化的专业运维. 为了了解运维 2.0 时代的监控方式,我们不妨从以前的监控手段说起.首先来了解一下 Zabbix ,通过 Zabbix 能够监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让系统管理员

Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识

Python 数据分析(二) 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识 第1节 groupby 技术 第2节 数据聚合 第3节 分组级运算和转换 第4节 透视表和交叉表 第5节 时间序列 第6节 日期的规范.频率以及移动 第7节 时区处理 第8节 时期及算术运算 第9节 重采样及频率转换 第10节 时间序列绘图 groupby 技术 一.实验简介 Python 数据分析(二)需要同学们先行学完 Python 数据分析(一)的课程. 对数据集进行分

Python 数据分析—第九章 数据聚合与分组运算

打算从后往前来做笔记 第九章 数据聚合与分组运算 分组 #生成数据,五行四列 df = pd.DataFrame({'key1':['a','a','b','b','a'], 'key2':['one','two','one','two','one'], 'data1':np.random.randn(5), 'data2':np.random.randn(5)}) df #可以按照key1分组计算data1的平均值 df.loc[:,'data1'].groupby(df.loc[:,'key

68 聚合和分组, F和Q查询, cookie, session

主要内容: 1  聚合和分组: a : 先导入聚合函数: from django.db.models import  Max, Min, Avg, Count, Sum b : 可以为聚合函数设置名字:  max = Max('price') c : 聚合用到了aggregate,  是queryset的一个终止语句,  获取的结果是一个字典的形式. 1 from django.db.models import Avg, Sum, Max, Min, Count 2 ret = models.B

14.SQL语句[6] 聚合、分组

--======================聚合函数============================ --求和sum 求平均avg 求个数count 最大值max 最小值min select sum(金额) as 总金额, avg(金额) as 平均金额, max(金额) as 最大金额, min(金额) as 最小金额, COUNT(*) as 订单数 from 数据 --为什么运行时报错? select 商品,SUM(金额) as 总金额 from 数据 --聚合之后的1个结果,

《利用python进行数据分析》读书笔记--第九章 数据聚合与分组运算

对数据进行分组并对各组应用一个函数,是数据分析的重要环节.数据准备好之后,通常的任务就是计算分组统计或生成透视表.groupby函数能高效处理数据,对数据进行切片.切块.摘要等操作.可以看出这跟SQL关系密切,但是可用的函数有很多.在本章中,可以学到: 根据一个或多个键(可以是函数.数组或DataFrame列名)拆分pandas对象 计算分组摘要统计,如计数.平均值.标准差.,或自定义函数 对DataFrame的列应用各种各样的函数 应用组内转换或其他运算,如规格化.线性回归.排名或选取子集等

Python数据聚合和分组运算(2)-Data Aggregation

在上一篇博客里我们讲解了在python里运用pandas对数据进行分组,这篇博客将接着讲解对分组后的数据进行聚合. 1.python 中经过优化的groupy方法 先读入本文要使用的数据集tips.csv tips=pd.read_csv('tips.csv') tips.head()

18 12 06 sql 的 基本语句 查询 条件查询 逻辑运算符 模糊查询 范围查询 排序 聚合函数 分组 分页 连接查询 自关联 子查询

-- 数据的准备 -- 创建一个数据库 create database python_test charset=utf8; -- 使用一个数据库 use python_test; -- 显示使用的当前数据是哪个? select database(); -- 创建一个数据表 -- students表 create table students( id int unsigned primary key auto_increment not null, name varchar(20) default