sql 语句系列(众数中位数与百分比)[八百章之第十五章]

众数

众数就是出现最多的那个数。

select sal,count(*) as cnt
from emp
where DEPTNO=20
group by sal

通过分组把他们的行数计算出来。那么最关键的部分在于,你如何知道最大值。

是的我们可以查出当前最大值,然后再取出最大值的sal。但是这肯定要用到两个临时视图。

注:我们不能通过排序cnt,然后取值第一个,因为可能存在相同的行数。

解决方案:通过dense_rank 进行排序。

科普一下概念:

row_number的用途非常广泛,排序最好用它,它会为查询出来的每一行记录生成一个序号,依次排序且不会重复,注意使用row_number函数时必须要用over子句选择对某一列进行排序才能生成序号。

rank函数用于返回结果集的分区内每行的排名,行的排名是相关行之前的排名数加一。简单来说rank函数就是对查询出来的记录进行排名,与row_number函数不同的是,rank函数考虑到了over子句中排序字段值相同的情况,如果使用rank函数来生成序号,over子句中排序字段值相同的序号是一样的,后面字段值不相同的序号将跳过相同的排名号排下一个,也就是相关行之前的排名数加一,可以理解为根据当前的记录数生成序号,后面的记录依此类推。

dense_rank函数的功能与rank函数类似,dense_rank函数在生成序号时是连续的,而rank函数生成的序号有可能不连续。dense_rank函数出现相同排名时,将不跳过相同排名号,rank值紧接上一次的rank值。在各个分组内,rank()是跳跃排序,有两个第一名时接下来就是第三名,dense_rank()是连续排序,有两个第一名时仍然跟着第二名。

答案:

sql server

select sal
from(
select sal,DENSE_RANK() over(order by cnt desc) as rnk
from (select sal,count(*) as cnt
from emp
where DEPTNO=20
group by sal
) x) y
where rnk=1

mysql

select sal,count(*) as cnt
from EMP
where DEPTNO=20
group by sal
HAVING COUNT(*)>=all(
select count(*)
from EMP
where DEPTNO=20
group by sal
)

因为mysql 没有DENSE_RANK,所以只能通过大于等于所有值来完成。这样就相当于查询了两遍。

中位数

这个比较简单:

sql service

select avg(SAL) as sal from
(select SAL,COUNT(*) over() total,CAST(COUNT(*) over() as decimal)/2 mid,CEILING((CAST(COUNT(*) over() as decimal)/2)) as next,
ROW_NUMBER() over(order by sal) rn
from emp
where DEPTNO=20) x
where (total%2=0 and rn in(mid,mid+1))
or (total%2=1 and rn=next)

可能看起来比较复杂,拆开来一下:

select SAL,COUNT(*) over() total,CAST(COUNT(*) over() as decimal)/2 mid,CEILING((CAST(COUNT(*) over() as decimal)/2)) as next,
ROW_NUMBER() over(order by sal) rn
from emp
where DEPTNO=20

这样就很清晰了。

mysql:

select avg(x.sal)
FROM(
select e.sal
from EMP e,EMP d
where e.deptno=d.deptno
and e.deptno=20
GROUP BY e.SAL
HAVING SUM(case when e.sal=d.sal then 1 else 0 end)>=abs(sum(sign(e.sal-d.SAL)))) x

一开始我也很懵逼,后来这样:

select e.sal,SUM(case when e.sal=d.sal then 1 else 0 end),abs(sum(sign(e.sal-d.SAL)))
from EMP e,EMP d
where e.deptno=d.deptno
and e.deptno=20
GROUP BY e.SAL

如果自己相同的数大于等于它左右两边差距数,那么其是中位数。

百分比

其他没什么值得注意的,就是算除法。

唯一值得关注的是:

如果是int类型,那么应该转换,再去计算。

CAST(x.d10 as decimal)

原文地址:https://www.cnblogs.com/aoximin/p/12617101.html

时间: 2024-11-10 14:49:13

sql 语句系列(众数中位数与百分比)[八百章之第十五章]的相关文章

sql 语句系列(行与列处理)[八百章之第一章]

排序时对null进行处理 比如说: select * from EMP order by COMM 我需要对红框部分进行desc处理,也就是从大到小排列. 解析: 重点是如何让null独立出去. select * from (select *,case when COMM is null then 0 else 1 end as COMMISNULL from EMP ) x order by COMMISNULL,COMM desc 解法:单独列出一列把null独立出去. 注意null的判断是

sql 语句系列(用魔法打败魔法)[八百章之第十章]

前言 下面是一些常规的运维手段. 查询每个表的行数 SELECT a.name, a.object_id, b.rows, b.index_id FROM sys.tables AS a INNER JOIN sys.partitions AS b ON a.object_id = b.object_id WHERE b.index_id IN ( 0, 1 ); 哦,对了,对有些大神说,去新公司的时候执行一下这个代码,如果行数不够直接跑路. 后续列举的所有的更新都放在这里,运维相关的.持续更新

“全栈2019”Java第八十五章:实现接口中的嵌套接口

难度 初级 学习时间 10分钟 适合人群 零基础 开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第八十五章:实现接口中的嵌套接口 下一章 "全栈2019"Java第八十六章:嵌套接口可以多继承吗? 学习小组 加入同步学习小组,共同交流与进步. 方式一:关注头条号Gorhaf,私信"Java学习小组". 方式二:关注公众号Gorhaf,回复"Java学习小组

sql 语句系列(字符串的遍历嵌入删除与统计)[八百章之第十一章]

遍历字符串 我觉得首先要提出一个疑问: 一个数据库本身就是用于存储的,遍历字符串究竟有何意义? 先看如何实现的,毕竟sql service 是没有for循环,也没有loop和while的. select SUBSTRING(e.ENAME,t.ID,1) as sub from emp e,T10 t where e.ENAME='JONES' and t.ID<=len(e.ENAME) 的确是遍历了这个字符串JONES. 原理也十分的简单: select * from T10 T10 可以看

sql 语句系列(闰年)[八百章之第十九章]

前言 判断闰年还是挺有用的. mysql select DAY(LAST_DAY(DATE_ADD(CURRENT_DATE,INTERVAL -DAYOFYEAR(CURRENT_DATE)+1+31 DAY))) as dy FROM T1 这个看起来有一点点复杂,其实拆开了还是很简单的. CURRENT_DATE 获取当前日期. DATE_ADD(CURRENT_DATE,INTERVAL -DAYOFYEAR(CURRENT_DATE)+1+31 DAY) 当前的日期,减去了从1月1号经

sql 语句系列(null 值处理)[八百章之第二章]

查找只存在一个表中的数据 有两张表: EMP: select * from emp DEPT: 他们有共同的属性:deptno 现在要查询EMP 中的deptno不等于DEPTNO的deptno项. 解析: select distinct DEPTNO from EMP where DEPTNO not in ( select DEPTNO from DEPT ) 注意: 因为需要查询的是DEPTNO,所以需要排除掉重复项. 其次上面的写法,如果DEPTNO在DEPT有null项上面的是错误的.

sql 语句系列(列举非索引外键)[八百章之第九章]

列举非索引外键 列举出那些外键没有添加索引. 目的: 1.减少锁. 2.外键添加索引,提示了查询性能,因为要与父表做连接查询做笛卡尔积. 下面只要会复制即可,没有会去从新写一遍的. select fkeys.table_name,fkeys.constraint_name,fkeys.column_name,ind_cols.index_name from ( select a.object_id,d.column_id,a.name table_name,b.name constraint_n

sql 语句系列(加减乘除与平均)[八百章之第十四章]

avg的注意事项 一张t2表: select * from t2 select AVG(sal) from t2 得到的结果是: 本来我们得到的结果应该是10的.但是得到的结果确实15. 这是因为忽略了null值. 解决方案: 当为空的时候转换为0 select AVG(coalesce(sal,0)) from t2 max 与 min的注意事项 max与min会忽略null,但是如果全是null的情况,会返回null值. select DEPTNO,max(COMM) from EMP wh

SQL必知必会 笔记 第十五章 插入数据

15.1数据插入 插入可以用几种方式使用: (1)插入完整的行 (2)插入行的一部分 (3)插入某些查询的结果 15.1.1插入完整的行 INSERT INTO Customers VALUES('1000000006', 'Toy Land', '123 Any Street', 'New York', 'NY', '11111', 'USA', NULL, NULL); 对每个列必须提供一个值,如果某个列没有值,应该用NULL值. 保证INSERT语句的更安全 INSERT INTO Cus