记一次业务中的大坑-MYSQL有重复数据下的增加主键

业务过程中，两张表求差

一开始一张小表，以为数据量不会很大，所以就没有做索引。
当实际运行过程中，小表慢慢长大了，发现两张表求差的时间能达到几个小时！！！AMAZING！
咋办，建索引呗
然后问题出现了，小表有重复数据，咋整，一个一个删除太sb了
写sql
DELETE FROM solr_indexed_max_incidentID WHERE incidentID IN (SELECT incidentID FROM solr_indexed_max_incidentID GROUP BY incidentID HAVING count(incidentID) > 1);
报错啦：
ERROR 1093 (HY000): You can‘t specify target table ‘solr_indexed_max_incidentID‘ for update in FROM clause
呵呵，不行
另想辙

先建一个临时表，把去重后的数据烤过来
create table solr_tmp as SELECT * FROM solr_indexed_nax_incidentID GROUP BY incidentID HAVING count(incidentID) > 1;

然后把原表删了
drop table solr_indexed_max_incidentID;（后来想到这样做太不专业，应该把这个表改个名字相当于备份在那儿，万一下一步出错了不懵逼了？）

然后改名字
RENAME TABLE solr_tmp TO solr_indexed_max_incidentID;

然后加索引
alter table ‘solr_indexed_max_incidentID‘ add primary key(‘incidentID‘);

继续运行业务逻辑，几秒钟求差完成！

时间： 2024-10-19 03:42:09

记一次业务中的大坑-MYSQL有重复数据下的增加主键的相关文章

MySQL 处理重复数据：防止表中出现重复数据、统计、过滤、删除重复数据

MySQL 处理重复数据有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 本章节我们将为大家介绍如何防止数据表出现重复数据及如何删除数据表中的重复数据. 防止表中出现重复数据你可以在 MySQL 数据表中设置指定的字段为 PRIMARY KEY(主键) 或者 UNIQUE(唯一) 索引来保证数据的唯一性. 让我们尝试一个实例:下表中无索引及主键,所以该表允许出现多条重复记录. CREATE TABLE person_tbl

MySQL 处理重复数据

有些 MySQL 数据表中可能存在重复的记录,有些情况我们允许重复数据的存在,但有时候我们也需要删除这些重复的数据. 本博文我们将为大家介绍如何防止数据表出现重复数据及如何删除数据表中的重复数据. 防止表中出现重复数据你可以在MySQL数据表中设置指定的字段为 PRIMARY KEY(主键) 或者 UNIQUE(唯一) 索引来保证数据的唯一性. 让我们尝试一个实例:下表中无索引及主键,所以该表允许出现多条重复记录. CREATE TABLE person_tbl ( first_name CH

mysql 删除重复数据的sql语句

CREATE TABLE tmp AS SELECT id FROM get_review_url WHERE (no,title,name,content) IN (SELECT no,title,name,content FROM get_review_url GROUP BY no,title,name,content HAVING COUNT(*) > 1) AND id NOT IN (SELECT MIN(id) FROM get_review_url GROUP BY no,tit

mysql 去除重复数据语句

纠结的过程: mysql> select * from role group by role_name,deleted; +---------+-----------+---------+ | role_id | role_name | deleted | +---------+-----------+---------+ | 2 | xue | 12 | | 1 | zhao | 12 | | 3 | zhao | 13 | +---------+-----------+---------+

MySQL中删除重复数据的简单方法，mysql删除重复数据

MYSQL里有五百万数据,但大多是重复的,真实的就180万,于是想怎样把这些重复的数据搞出来,在网上找了一圈,好多是用NOT IN这样的代码,这样效率很低,自己琢磨组合了一下,找到一个高效的处理方式,用这个方式,五百万数据,十来分钟就全部去除重复了,请各位参考. 第一步:从500万数据表data_content_152里提取出不重复的字段SFZHM对应的ID字段到TMP3表 create table tmp3 as select min(id) as col1 from data_content

19 MySQL概念数据库数据表数据类型增加删除修改查询 WHERE Order By Limit

数据库管理系统DBMS 数据库中相关概念数据库数据表记录字段数据登录和退出MySQL客户端查询自己的MySQL服务器有几个数据库二.退出MySQL客户端的命令修改root用户的密码在MySQL客户端来修改密码(当前账号的密码) 数据库操作创建数据库显示所有数据库删除数据库选择数据库更改数据库默认字符集数据表操作显示当前数据库中的所有表创建数据表显示表的创建列的常用属性修改数据表删除数据表显示表结构 MySQL数据类型整型浮点型字符型文本型日

mysql 删除重复数据

如题:mysql 数据库删除重复数据因为是mysql 所以其他数据哭的命令在mysql 中是不能使用的.不要想当然的使用sql 脚本 delete from table1 where field1 in (select field1 from table1 group by field1 having count(field1) > 1) and rowid not in (select min(rowid) from table1 group by field1 having count(f

关于mybatis用mysql时，插入返回自增主键的问题

公司决定新项目用mybatis,虽然这个以前学过但是一直没用过都忘得差不多了,而且项目比较紧,也没时间去系统点的学一学,只好很粗略的百度达到能用的程度就行了. 其中涉及到插入实体要求返回主键id的问题,以前用ssh配合oracle很容易实现,因为有sequence,而且mysql也基本没用过,所以只好去百度了. 这个内容还是比较好查的,如下: <?xml version="1.0" encoding="UTF-8" ?><!DOCTYPE mapp

MYSQL删除重复数据

delete from co_jobinformation cwhere c.name in (select cc.name from co_jobinformation cc group by cc.name having count(cc.name) > 1)and rowid not in (select min(rowid) from co_jobinformation e group by e.name having count(e.name )>1) 之前在oracle数据库

猜你喜欢

request \response 总结

request&response request 1.获得信息的方法 1> 获得请求首行信息的方法 *getMethod *getContextP ...

DTD文档类型定义文件简介

dtd 基本概念: dtd ( document type definition 文档类型定义),该文件一般和xml文件配合使用, 主要的用处是约束 xml. 除了 dtd 技术外, 还有一个sch ...

每日目标——HTML 头部标签学习 2015-8-27

<head> <title>bp</title> <meta http-equiv="Content-Type" content=&quo ...

php获取路径

php获取当前页面url路径 #測试网址: http://localhost/blog/testurl.php?id=5 //获取域名或主机地址 echo $_SERVER['HTTP_HOST']. ...

站长想网站被收录，这些事情千万要注意

SEO新手们在网站建完之后遇到一个问题:网站收录的太慢了.这个问题几乎是最为困扰SEOer的一个了,小编表示,大家作为站长,应该清楚,新站在上线后都是会有一个考核期的,通常在1到3个月之间的,在今年的 ...

利用ARCGIS转换免费下载的谷歌卫星影像（默认WGS84坐标系）

卫星影像可以当做我们内业成图时的工作参考.目前市面上出现的几款好用的卫星图片下载工具,比如91卫图助手.bigemap等软件,都可以自定义导出坐标系及参数,但存在使用限制,比如限制了单次下载大小或者每 ...

HDU 5616 Jam's balance（Jam的天平）

p.MsoNormal { margin: 0pt; margin-bottom: .0001pt; text-align: justify; font-family: Calibri; font-s ...

crontab的使用笔记

1 crond简介crond是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务工具,并且会自动启动cron ...

cocos js 3.8.1 clippingNode 不能被 ccui.ScrollView 或者ccui.Layout裁剪的bug

clippingNode不能被ccui.ScrollView.ccui.ListView.ccui.Layout裁剪问题,只需要设置scrollView ...的裁剪类型 scrollView.se ...

通过java.net.URLConnection发送HTTP请求的方法

1.GET与POST请求的区别 a) get请求可以获取静态页面,也可以把参数放在URL字串后面,传递给servlet, b) post与get的不同之处在于post的参数不是放在URL字串里面,而是 ...

新站在外链建设和推广等方面上注意的问题

现在站长朋友们对于站点的关键词排名的重要性认识已经异常的深刻,如何才能做好新站的外链和推广呢?关于这个话题已经有不少朋友讨论过,今天笔者将主要综合几种常见的观点,谈谈新站该从哪几个方面着手外链和推广. ...

去百度API的百度地图准确叠加和坐标转换的解决方案研究

1.背景目前项目上如果要使用百度地图,得加载百度的开发包,然后通过百度提供的接口来调用百度地图以及将需要标记的点显示在百度地图中等等. 此方案存在明显劣势: a.对原系统的破坏.一套从底层开发的系统 ...

STATA一小步我的一大步

第一次用STATA,以前一直搞SPSS,简直是生产力革命啊. 记下写的第一个命令也是实现了一个probit回归 clear cd C:\Users\Qian\Desktop\1 insheet us ...

在大型项目上，Python 是个烂语言吗

Robert Love, Google Software Engineer and Manager on Web Search. Upvoted by Kah Seng Tay, I was the ...

css万能清除原理

如果现在能有清理浮动的办法,但不至于在文档中多一个没有用的空标记,这时的效果是最好的!引入:after伪元素选择器,可以在指定的元素的内容添加最后一个子元素 .container:after{ } 如 ...

angularJS 如何读写缓冲

写在前面 1.在客户端.服务端架构中,HTTP协议是主流通信技术: 2.HTTP协议的无状态特性,节省带宽,较少服务器的负载,缓冲技术具有重要的运用:这里主要讲解在客户端浏览器中angular如何读写 ...

IOS中DES与MD5加密方案

0 2 项目中用的的加密算法,因为要和安卓版的适配,中间遇到许多麻烦. MD5算法和DES算法是常见的两种加密算法. MD5:MD5是一种不可逆的加密算法,按我的理解,所谓不可逆,就是不能解密,那 ...

HttpWebRequest使用总结

HttpWebRequest的KeepAlive默认是true,如果使用的时候仅仅只是关闭流,不关闭网卡上的通道的话,第二个请求在TCP没有关闭的情况下是走同一个通道,此时本机的TCP通道就会抛异常出 ...

教程-Delphi中比较两个对象是否一致及地址是否相同

资料说明: 1.http://blog.csdn.net/diligentcatrich/article/details/7077294 说明: 实例代码: 1 procedure TForm1.bt ...

AngularJS“多重路由”嵌套模块——AngularJS“路由”嵌套学习资料教程

这是小编的一些学习资料,理论上只是为了自己以后学习需要的,但是还是需要认真对待的以下内容仅供参考,请慎重使用学习 1.AngularJS路由嵌套 Angularjs本身自带路由模块,可以满足通过不同 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.