在实际开发中,我们往往需要比较两个或多个表数据的差别,比较那些数据相同那些数据不相同,这时我们有一下三种方法可以使用:1. IN或NOT IN,2. EXIST或NOTEXIST,3.使用连接查询(inner join,left join 或者 right join)。
看下面的数据,我们准备选择出在depart_info中的pid在user_info中不存在的depart_信息。
有表1:depart_info
表2:user_info
方法一:采用NOT IN
IN和NOT IN后面接的是一个集合,in 是把外表和内表作hash 连接。
[sql] view plain copy
- SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);
经测试耗时在0.002s左右。
方法二:采用NOT EXISTS
EXISTS 和 NOT EXISTS是对外表作loop循环,每次loop循环再对内表进行查询,
[sql] view plain copy
- SELECT d.* FROM depart_info d WHERE NOT EXISTS (SELECT * FROM user_info u WHERE d.pid = u.pid);
经测试耗时在0.002s左右。
方法三:采用连接查询
连接查询包括:
1、自连接(join 等同于inner join ):查询结果为两边都存在的数据
2、左连接 left join :返回左边全部数据,右边存在返回,不存在为null
3、 右连接 right join :返回右边全部数据,左边存在返回,不存在为null
4、 全连接 full join :只要某个表中存在就返回,另一个不存在为nul
[sql] view plain copy
- SELECT d.* FROM depart_info d LEFT JOIN user_info u ON d.pid = u.pid WHERE u.pid IS NULL ;
经测试耗时在0.001s左右
总结:
1、对于小量数据exists 和in差不多,如果数据较多的话(在百万行)建议使用exists,更好的话使用关联查询。
2、数量较小,如果两个表中一个较小,一个是大表,则子查询表大的用exists,子查询表小的用in。
3、如果子查询中返回的任意一条记录含有空值,则IN查询将不返回任何记录,这点需注意。
4、返回数据是两个表的多个字段数据,建议使用关联查询。不仅速度快,而且返回数据可以自定义。