业务过程中,两张表求差
一开始一张小表,以为数据量不会很大,所以就没有做索引。
当实际运行过程中,小表慢慢长大了,发现两张表求差的时间能达到几个小时!!!AMAZING!
咋办,建索引呗
然后问题出现了,小表有重复数据,咋整,一个一个删除太sb了
写sql
DELETE FROM solr_indexed_max_incidentID WHERE incidentID IN (SELECT incidentID FROM solr_indexed_max_incidentID GROUP BY incidentID HAVING count(incidentID) > 1);
报错啦:
ERROR 1093 (HY000): You can‘t specify target table ‘solr_indexed_max_incidentID‘ for update in FROM clause
呵呵,不行
另想辙
先建一个临时表,把去重后的数据烤过来
create table solr_tmp as SELECT * FROM solr_indexed_nax_incidentID GROUP BY incidentID HAVING count(incidentID) > 1;
然后把原表删了
drop table solr_indexed_max_incidentID;(后来想到这样做太不专业,应该把这个表改个名字相当于备份在那儿,万一下一步出错了不懵逼了?)
然后改名字
RENAME TABLE solr_tmp TO solr_indexed_max_incidentID;
然后加索引
alter table ‘solr_indexed_max_incidentID‘ add primary key(‘incidentID‘);
继续运行业务逻辑,几秒钟求差完成!