sql语句_ 的三种去重方法

本文将介绍用 distict、group by 和 row_number() over 。

注：这里的去重是指：查询的时候, 不显示重复，并不是删除表中的重复项，关系删除表中重复数据的sql 请参考一下链接：

https://www.cnblogs.com/171207xiaohutu/p/11520763.html

1. distinct

表userinfo 数据如下：

id	name	age	height
10	xiaogang	23	181
11	xiaoli	31	176
12	xiaohei	22	152
13	xiaogang	26	172
14	xiaoming	31	176


现在需要当前用户表不重复的用户名select distinct name from userinfo

如结果（1）：name xiaogangxiaoheixiaolixiaoming

可是我现在又想得到Id的值，改动如下

select distinct name,id from userinfo

如结果（2）

xiaogang 10
xiaoli 11
xiaohei 12
xiaogang 13
xiaoming 14

此时distinct同时作用了两个字段，即必须得id与name都相同的才会被排除

2. group by

select name

from userinfo

groub by name

运行上面3行sql的结果如上面distinct中的结果（1）

select name,id

from userinfo

groub by name ,id

运行上面3行sql的结果如上面distinct的结果（2）

3. row_number() over

SQL Server 通过Row_Number 函数给数据库表的记录进行标号，在使用的时候后面会跟over 子句，而over 子句主要用来对表中的记录进行分组和排序的。

语法如下:

ROW_NUMBER() OVER(PARTITION BY COLUMN1 ORDER BY COLUMN2)

1:Partition BY 用来分组

2：Order by 用来排序

接下来用 row_number（） over 进行去重。首先用name 进行分组，id进行排序。

具体SQL 语句如下

SELECT * FROM (
select *,ROW_NUMBER() over(partition by name order by id desc) AS rn from userinfo ) AS u WHERE u.rn=1

结果如下

id name age height rn

13 xiaogang 26 172 1
12 xiaohei 22 152 1
11 xiaoli 31 176 1
14 xiaoming 31 176 1

通过使用 row_number over 子句就能将所有的列展示出来，同时进行去重。

4.思考

distinct 和group by 的区别：

（1）distinct常用来查询不重复记录的条数：count(distinct name)，group by 常用它来返回不重记录的所有值。

（2）在使用group by 分组后，在select中可以选择分组字段，和非分组字段的函数值，如 max()、min()、sum、count()等

distinct 和row_number over()区别:

（1）distinct 和 row_number over 都可以实现去重功能，而distinct 作用于当行的时候，其"去重" 是去掉表中字段所有重复的数据，作用于多行的时候是，其"去重"所有字段都相同的数据。

（2）在使用row_number over 子句时候是先分组，然后进行排序，再取出每组的第一条记录"去重"

原文地址：https://www.cnblogs.com/171207xiaohutu/p/11520759.html

时间： 2024-10-01 22:01:12

sql语句_ 的三种去重方法的相关文章

SQL SERVER 2008 中三种分页方法与总结

建立表: 1 CREATE TABLE [TestTable] ( 2 [ID] [int] IDENTITY (1, 1) NOT NULL , 3 [FirstName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , 4 [LastName] [nvarchar] (100) COLLATE Chinese_PRC_CI_AS NULL , 5 [Country] [nvarchar] (50) COLLATE Chinese_PRC_C

转:访问 Microsoft SQL Server 元数据的三种方法

上海微创软件有限公司肖桂东适用读者:Microsoft SQL Server 中.高级用户元数据简介元数据 (metadata) 最常见的定义为"有关数据的结构数据",或者再简单一点就是"关于数据的信息",日常生活中的图例.图书馆目录卡和名片等都可以看作是元数据.在关系型数据库管理系统 (DBMS) 中,元数据描述了数据的结构和意义.比如在管理.维护 SQL Server 或者是开发数据库应用程序的时候,我们经常要获取一些涉及到数据库架构的信息:某个数据库中

Android中常用的三种存储方法浅析

Android中常用的三种存储方法浅析 Android中数据存储有5种方式: [1]使用SharedPreferences存储数据 [2]文件存储数据 [3]SQLite数据库存储数据 [4]使用ContentProvider存储数据 [5]网络存储数据在这里我只总结了三种我用到过的或即将可能用到的三种存储方法. 一.使用SharedPreferences存储数据 SharedPreferences是Android平台上一个轻量级的存储类,主要是保存一些常用的配置信息比如窗口状态,它的本质是基

C#使用DataSet Datatable更新数据库的三种实现方法

本文以实例形式讲述了使用DataSet Datatable更新数据库的三种实现方法,包括CommandBuilder 方法.DataAdapter 更新数据源以及使用sql语句更新.分享给大家供大家参考之用.具体方法如下: 一.自动生成命令的条件 CommandBuilder 方法 a)动态指定 SelectCommand 属性 b)利用 CommandBuilder 对象自动生成 DataAdapter 的 DeleteCommand.InsertCommand 和 UpdateCommand

Liunx 环境下vsftpd的三种实现方法（超详细参数）

以下文章介绍Liunx 环境下vsftpd的三种实现方法 ftp://vsftpd.beasts.org/users/cevans/vsftpd-2.0.3.tar.gz,目前已经到2.0.3版本.假设我们已经将vsftpd-2.0.3.tar.gz文件下载到服务器的/home/xuchen目录代码: # cd /home/xuchen # tar xzvf vsftpd-2.0.3.tar.gz //解压缩程序 # cd vsftpd-2.0.3 三.三种方式的实现

JS面向对象（3） -- Object类，静态属性，闭包，私有属性， call和apply的使用，继承的三种实现方法

相关链接: JS面向对象(1) -- 简介,入门,系统常用类,自定义类,constructor,typeof,instanceof,对象在内存中的表现形式 JS面向对象(2) -- this的使用,对象之间的赋值,for...in语句,delete使用,成员方法,json对象的使用,prototype的使用,原型继承与原型链 JS面向对象(3) -- Object类,静态属性,闭包,私有属性, call和apply的使用,继承的三种实现方法 1.Object类在JS中,Object是所有类的基

水晶报表的三种筛选方法

目录: 一.解决方案一:报表数据访问使用推模型二.解决方案二:记录选定公式运行时自定义三.解决方案三:将参数合并到记录选定公式 ---------------------------------- 解决方案一: 报表数据访问使用推模型需要开发人员编写代码以连接到数据库,执行 SQL 命令以创建与报表中的字段匹配的记录集或数据集,并且将该对象传递给报表.该方法使您可以将连接共享置入应用程序中,并在 Crystal Reports 收到数据之前先将数据筛选出来. ---------------

SQL Server数据库的三种恢复模式：简单恢复模式、完整恢复模式和大容量日志恢复模式

SQL Server数据库的三种恢复模式:简单恢复模式.完整恢复模式和大容量日志恢复模式这篇文章主要介绍了SQL Server数据库的三种恢复模式:简单恢复模式.完整恢复模式和大容量日志恢复模式,需要的朋友可以参考下如何图形界面下修改恢复模式找到你想修改的数据库右键 > 属性 > 左侧选项既可看到 1.Simple 简单恢复模式, Simple模式的旧称叫"Checkpoint with truncate log",其实这个名字更形象,在Simple模式下,SQ

谈谈vector容器的三种遍历方法

说明:本文仅供学习交流,转载请标明出处,欢迎转载! vector容器是最简单的顺序容器,其使用方法类似于数组,实际上vector的底层实现就是采用动态数组.在编写程序的过程中,常常会变量容器中的元素,那么如何遍历这些元素呢?本文给出三种遍历方法. 方法一:采用下标遍历由于vector容器就是对一个动态数组的包装,所以在vector容器的内部,重载了[]运算符,函数原型为:reference operator [] (size_type n);所以我们可以采用类似于数组的方式来访问vector容