mysql 去重留一

首先先分析一下我们现在的目的是查询到这俩张表的所有数据然后进行删除重复记录每条数据只保留一条

第一步：
查询以下俩张表的重复记录 (关键字段重复>1)
ks_examcity 、 ks_examdistrict

select * from ks_examcity group by examSubjectID,city,province having count(examSubjectID)>1;
select * from ks_examdistrict group by examSubjectID,district,city having count(examSubjectID)>1;

第二步：
   查询这两张表中 每条记录的第一条记录 (每条记录重复中的第一条 id最小)
select min(id)
  from ks_examcity
 group by examSubjectID, city, province
having count(examSubjectID)> 1

SELECT min(id)
  FROM `ks_examdistrict`
 GROUP BY `examSubjectID`, `district`, `city`
HAVING COUNT(`examSubjectID`)> 1

第三步：
    联查： 查询所有的重复数据以及重复记录中第一条以外的数据
select `examSubjectID`
  from ks_examcity
 group by examSubjectID, city, province
having count(examSubjectID)> 1 )
   and id not in(
select min(id)
  from ks_examcity
 group by examSubjectID, city, province
having count(examSubjectID)> 1

SELECT `examSubjectID`
  from `ks_examdistrict`
 group by `examSubjectID`, `district`, `city`
HAVING COUNT(`examSubjectID`)> 1)
   and id not in(
SELECT min(id)
  FROM `ks_examdistrict`
 GROUP BY `examSubjectID`, `district`, `city`
HAVING COUNT(`examSubjectID`)> 1

第四步：  查询以上查询到的数据的所有id  并以查询到的id作为条件 进行删除

delete from `ks_examcity`  where id IN(  select id from (
select  id
  from ks_examcity
 where `examSubjectID` in(
select `examSubjectID`
  from ks_examcity
 group by examSubjectID, city, province
having count(examSubjectID)> 1 )
   and id not in(
select min(id)
  from ks_examcity
 group by examSubjectID, city, province
having count(examSubjectID)> 1)) as  tmpresult)

======================================================

DELETE
  FROM `ks_examdistrict`
 where id IN(
SELECT id
  from(
select id
  from `ks_examdistrict`
 where `examSubjectID` in(
SELECT `examSubjectID`
  from `ks_examdistrict`
 group by `examSubjectID`, `district`, `city`
HAVING COUNT(`examSubjectID`)> 1)
   and id not in(
SELECT min(id)
  FROM `ks_examdistrict`
 GROUP BY `examSubjectID`, `district`, `city`
HAVING COUNT(`examSubjectID`)> 1)) as tmpresult)

参考文章：https://www.cnblogs.com/jdbeyond/p/8157224.html

原文地址：https://blog.51cto.com/13922718/2433185

时间： 2024-10-11 01:17:10

mysql 去重留一的相关文章

mysql去重查询表中数据

1.distinct select count(distinct CName) from teble select count(CName) from (select distinct CName from Course) as temp SELECT DISTINCT text_zhcn FROM dms_menuconfig -- 去重查询表中数据 select DISTINCT(user_id) from user_info where children_merchant_id='kuai

将MySQL去重操作优化到极致之三弹连发（一）：巧用索引与变量

元旦假期收到阿里吴老师来电,被告知已将MySQL查重SQL优化到极致:100万原始数据,其中50万重复,把去重后的50万数据写入目标表只需要9秒钟.这是一个惊人的数字,要知道仅是insert 50万条记录也需要些时间的.于是来了兴趣,自己实验.思考.总结做了一遍. 一.问题提出源表t_source结构如下:item_id int,created_time datetime,modified_time datetime,item_name varchar(20),other var

将MySQL去重操作优化到极致之三弹连发（二）：多线程并行执行

上一篇已经将单条查重语句调整到最优,但该语句是以单线程方式执行.能否利用多处理器,让去重操作多线程并行执行,从而进一步提高速度呢?比如我的实验环境是4处理器,如果使用4个线程同时执行查重sql,理论上应该接近4倍的性能提升. 一.数据分片我们生成测试数据时,created_time采用每条记录加一秒的方式,也就是最大和在最小的时间差为50万秒,而且数据均匀分布.因此先把数据平均分成4份. 1. 查询出4份数据的created_time边界值 select date_add('20

mysql去重的最方便的两种方法

参考资料:http://blog.csdn.net/guocuifang655/article/details/3993612 方法一: 在使用mysql时,有时需要查询出某个字段不重复的记录,虽然mysql提供有distinct这个关键字来过滤掉多余的重复记录只保留一条,但往往只用它来返回不重复记录的条数,而不是用它来返回不重记录的所有值.其原因是 distinct只能返回它的目标字段,而无法返回其它字段下面先来看看例子: table id name 1 a 2 b

mysql去重

--1)查询时忽略重复值 SELECT DISTINCT City FROM Student --2)查询成绩分布分布情况 SELECT DISTINCT(Score), Count(ID) FROM Student GROUP BY Score --学生成绩可能重复,以此得到分数.得到这一成绩的学生数. --DISTINCT是关键词 select count(DISTINCT send_uid) from gift_record

mysql 去重

方法1 SELECT DISTINCT 字段1,字段2,字段3 FROM 表; 方法2 SELECT 字段1,字段2,字段3 FROM 表 GROUP BY 字段1,字段2,字段3

Mysql ndb_Cluster 测试环境搭建

系统环境:Centos6.3 + mysql-cluster-gpl-7.1.15a-linux-x86_64-glibc23.tar .gz 说明:1) MySQLCluster 的启动:启动顺序:管理服务器 --> 存储节点 --> SQL 节点2) 安全关闭 ndb cluster:关闭顺序:SQL 节点 --> 数据节点 --> 管理节点.# /usr/local/mysql/

MySQL学习——查询表里的数据

MySQL学习——查询表里的数据摘要:本文主要学习了使用DQL语句查询表里数据的方法. 数据查询语法 1 select [distinct] 列1 [as '别名1'], ..., 列n [as '别名n'] from 表名 2 [where 表达式] 3 [group by 表达式] 4 [having 表达式] 5 [order by 表达式] 6 [limit 起始编号, 查询条数] 说明 1 列1, ..., 列n:表示查询的字段,查询多个字段用“,”分隔,使用“*”号表示查询全部字

数据库学习之mysql数据库

参考链接网站: http://c.biancheng.net/view/2361.html Mysql的版本以及版本号 MySQL Community Server(社区版):该版本完全免费,但是官方不提供技术支持. MySQL Enterprise Server(企业版):该版本能够以很高的性价比为企业提供数据仓库应用,支持 ACID 事物处理,提供完整的提交.回滚.崩溃恢复和行级锁定功能,但是该版本需要付费使用,官方提供电话技术支持. Mysql服务器端实用工具: http://c.bian