MySQL学习分享-->查询-->查询的分类

MySQL的查询可以分为交叉联接、内联接、外联接、自然联接、straight_join

下面对于查询的学习,会用到以下四张表:

create table t_commodity_type(

`id` BIGINT(20) not null auto_increment comment ‘商品类别ID‘,

`time` TIMESTAMP not null DEFAULT CURRENT_TIMESTAMP comment ‘入库时间‘,

`name` VARCHAR(32) not null DEFAULT ‘‘ comment ‘名称‘,

`is_use` bit(1) not null DEFAULT b‘0‘ comment ‘是否上架‘,

primary key (`id`)

)engine=innodb DEFAULT CHARSET=utf8 comment ‘商品类型表‘;

create table t_commodity(

`id` BIGINT(20) not null auto_increment comment ‘商品ID‘,

`commodity_type_id` BIGINT(20) not null DEFAULT 0 COMMENT ‘商户所属类别ID‘,

`time` TIMESTAMP not null DEFAULT CURRENT_TIMESTAMP comment ‘入库时间‘,

`name` varchar(64) not null DEFAULT ‘‘ comment ‘商品名称‘,

`price` DECIMAL(20,2) not null DEFAULT 0.00 comment ‘价格‘,

`is_use` bit(1) not null DEFAULT b‘0‘ comment ‘是否上架‘,

PRIMARY key (`id`),

key `com_typ_id` (`commodity_type_id`) using BTREE

)engine=innodb DEFAULT charset=utf8 COMMENT ‘商品表‘;

CREATE TABLE `t_user_collect` (

`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT ‘主键id‘,

`user_id` bigint(20) NOT NULL DEFAULT ‘0‘ COMMENT ‘用户id‘,

`commodity_id` bigint(20) NOT NULL DEFAULT ‘0‘ COMMENT ‘商品id‘,

`name` varchar(64) NOT NULL DEFAULT ‘‘ COMMENT ‘商品名称‘,

`price` decimal(20,2) NOT NULL DEFAULT ‘0.00‘ COMMENT ‘商品价格‘,

PRIMARY KEY (`id`),

KEY `index_user_id` (`user_id`) USING BTREE,

KEY `index_commodity_id` (`commodity_id`) USING BTREE

) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=‘用户收藏表‘;

CREATE TABLE `t_user_order` (

`id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT ‘用户订单id‘,

`user_id` bigint(20) NOT NULL DEFAULT ‘0‘ COMMENT ‘用户id‘,

`commodity_id` bigint(20) NOT NULL DEFAULT ‘0‘ COMMENT ‘商品id‘,

`name` varchar(64) NOT NULL DEFAULT ‘‘ COMMENT ‘商品名称‘,

`price` decimal(20,2) NOT NULL DEFAULT ‘0.00‘ COMMENT ‘商品价格‘,

PRIMARY KEY (`id`),

KEY `index_user_id` (`user_id`) USING BTREE,

KEY `index_commodity_id` (`commodity_id`) USING BTREE

) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT=‘用户订单表‘;

 

我们在查询原理中有讲解SQL中各子句的执行顺序,因此无论from子句后的表有多少张,都先是第一张表和第二表执行完from、on、join后,再与第三张表重复该操作(from、on、join),一直到与最后一张表执行完该操作。

虽然原理是这样,但是对于交叉联接来说,其只有from的操作;对内联接来说,其只有from、on操作;而对于外联接来说,其有from、on、join操作。

①交叉联接(cross join)

对两表做笛卡尔积,这将返回两表所有列的组合,若表A有m行数据,表B有n行数据,则cross join将返回m*n行数据。如下SQL实例,

select uc.user_id as user_id, c.id as commodity_id, uc.`name` as `name`, uc.price as price

from t_commodity c cross join t_user_collect uc;

当然我们可以以一种更简单的语法来实现,

select uc.user_id as user_id, c.id as commodity_id, uc.`name` as `name`, uc.price as price

from t_commodity c, t_user_collect uc;

不用担心,两者的执行计划是一样的,

需要注意的是使用交叉联接就是想得到两表的笛卡尔积,虽然也可以配合on子句来使用,但实际当我们拿到两表的笛卡尔积后再去使用on,从行为上来说我们是想要得到两表关联的数据,那么就符合了内联接(inner join)的使用条件,因此在这种情况下,我们更应该去选择内联接(inner join)。

那么cross join在实际中有哪些应用呢?其实可以利用它产生笛卡尔积的特点用来快速生成大量测试数据,如下SQL:

insert into t_user_order(user_id,commodity_id,`name`,price)

select uc.user_id as user_id, c.id as commodity_id, uc.`name` as `name`, uc.price as price

from t_commodity c cross join t_user_collect uc;

 

 

②内联接(inner join)

通过on子句来匹配两表的记录,查询出来的数据是两表的交集。

拿t_commodity和t_commodity_type两张表来举例子,从表结构上看t_commodity表通过commodity_type_id列和t_commodity_type表的id列产生了关联,我们看一个SQL实例,

select c.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity_type ct inner join t_commodity c on ct.id=c.commodity_type_id;

查询结果如下(仅截取了局部数据),

以上SQL可以通过另外几种形式来实现,如下:

1)省略inner关键字的实现

select c.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity_type ct join t_commodity c on ct.id=c.commodity_type_id;

2)不接on子句,通过逗号分隔表来实现

select c.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity_type ct, t_commodity c where ct.id=c.commodity_type_id;

3)通过cross join和on子句来实现

select c.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity_type ct cross join t_commodity c on ct.id=c.commodity_type_id;

总共四种实现方式,它们的执行计划都是一样的,

额外知识点

为什么可以通过另外三种形式来实现呢?

1)在使用inner join时,inner关键字本身就是可以被省略的。

2)这其实是旧语法和新语法的区别,对于两表之间使用逗号分隔,且无on子句的SQL书写是ANSI(美国国家标准学会) SQL 89的规范,因为ANSI SQL 89在当时不支持on和join子句,而是直到ANSI SQL 92才引入的。

虽说是两种不同的语法,但MySQL对两者都是完全兼容的,两种书写方式无所谓好坏与否。MySQL优化器会为两者生成相同的执行计划,因此在执行效率及结果上都是一致的,至于在实际项目中使用哪种语法则取决于你所在公司的SQL规范。

3)inner join后不跟on子句,也可以通过MySQL语法解析,这时inner join就等于cross join,因为在MySQL数据库中cross join和inner join是同义词关系。因此,cross join也是可以配合on子句来使用的,只是一般很少这样做。

额外知识点

我们看到在SQL中on和where子句后都可以接过滤条件,那有没有一些通用的放置规则呢?

对两表的匹配条件一般放在on子句中,而对一个表过滤数据的条件一般放在where子句中。

③外联接(outer join)

外联接有两种,第一种是左外联接(left outer join),第二种是右外联接(right outer join)。

这种联接也是通过on子句来匹配两表的记录,但它与inner join不同的地方在于若是左外联接,则左表的记录会被全部获取,即便左表中的列无法通过on子句与右表发生匹配,这部分无匹配关系但依然被获取出来的记录,称之为外部行,而左表就被称之为保留表,若使用的是右外联接,那右表就是保留表。

 

我们来看一个SQL实例,

select ct.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity_type ct left join t_commodity c on ct.id=c.commodity_type_id;

查询结果如下(仅截取了局部数据):

这个查询通过t_commodity_type表的id和t_commodity表的commodity_type_id进行匹配,由于有些商品类型在商品表中无对应关系,但又需要保留这部分行显示出来(添加外部行),于是可以看到结果中不属于t_commodity_type表的列值(c.`name`、c.time)被填充为Null(因未匹配而被添加的记录,其中不属于保留表的列值会被null填充)。

而对于右外联接,它的原理与左外联接一致,上面那个SQL用右外联接来实现就是:

select ct.id as id, ct.`name` as type_name, c.`name` as `name`, c.time as time

from t_commodity c right join t_commodity_type ct on c.commodity_type_id=ct.id;

 

可以看到在书写左外连接和右外连接时都没有加outer关键字,因为它是可以被省略的,这会使语法看起来更简洁。同样的左外联接、右外联接也可以简称为左联接、右联接,只要不要忘了它俩都属于outer join。

另外inner join即便省略了on子句也可以使用,但outer join就必须配合on子句来使用。这是因为inner join在省略了on子句后,就单纯的用于产生笛卡尔积了,其作用就等于cross join。而outer join会对保留表添加外部行,在没有on子句进行条件过滤的情况下,怎么会有添加外部行的操作呢。

额外知识点

如果on子句中的列具有相同的名称,那么可以使用using来简化SQL。我们来看一个实例,

简化前:

select uo.commodity_id, uo.`name` from t_user_order uo inner join t_user_collect uc on

uo.commodity_id=uc.commodity_id;

简化后:

select uo.commodity_id, uo.`name` from t_user_order uo inner join t_user_collect uc using (commodity_id);

这个SQL是想知道订单中的哪些商品原本是被用户收藏的。由于t_user_order表的commodity_id列与t_user_collect表的commodity_id列同名,因此我们使用了using来简化书写。两者的执行计划和结果都是一样的。

④自然联接(natural join)

自然联接会将两表中具有相同名称的列进行匹配。

我们用t_user_collect、t_user_order两表来做说明,t_user_collect表中的数据如下,

t_user_order表中的数据如下,

对两表使用自然联接,select * from t_user_order natural join t_user_collect;(这里我们为了方便演示使用了*,在实际开发中不建议这样做),我们可以看到以下数据被筛选出来,

怎么理解?由于两表每列名称都相同,因此只有每列的值都一致,才会匹配。观察两表数据,仅id为2的每列数据是一致的。假如我们将t_user_collect表中几个列名做修改,仅保留commodity_id,再看看会有怎样的匹配效果,修改后的t_user_collect表如下,

我们再执行select * from t_user_order natural join t_user_collec;(这里我们为了方便演示使用了*,在实际开发中不建议这样做),会得到以下数据,

可以看到有4行数据,因为commodity_id列在两表中是能产生4行数据匹配的,看到这里大家应该对natural join的使用效果较为明白了。简单来说就是当两表中仅有一个列名相同时,那么就会用这个列作为条件来匹配,而如果两表中每个列名都相同,那么就会用所有的列作为条件来匹配。

接下来我们再探讨两个问题,

1)相同名称但数据类型不同的列会产生匹配吗?

2)是否能以其它的联接方式来实现natural join的效果?

关于第1)个问题,我们可以做如下实验,对t_user_collect表的commodity_id列修改数据类型,再执行查询得到结果如下,

我们可以看到查询出的4行结果与之前的4行结果一致,这说明同名称的列虽然数据类型不同,但不会对natural join的匹配产生影响。

关于第2)个问题,就拿刚刚那个查询SQL:“select * from t_user_order natural join t_user_collec;”来说,它可以改写成如下形式:“select * from t_user_order inner join t_user_collect using(commodity_id);”。

实际上natural join等同于inner join和using的组合。

⑤straight_join

注意两个单词之间是有一个下划线连接的,straight_join会强制MySQL优化器先读取该子句左边的表。

因为我们在查询语句中书写的表联接顺序,到了MySQL实际执行时由于优化器的作用,联接顺序可能会发生变化,而straight_join就可以让MySQL按照我们指定的顺序去联接表,有一种强制作用。当然我们在使MySQL按照我们的意愿去联接表时,需要确保其执行效率要高于优化器原本的优化效果,不然就是坑自己。

来看一个SQL实例,

select * from t_commodity_type ct inner join t_commodity c on ct.id=c.commodity_type_id; 其执行计划如下,

我们可以看到虽然t_commodity_type表是写在inner join子句左边的,但MySQL先读取的却是t_commodity表,我们将上述SQL的inner join替换为straight_join,看看有什么变化,

从上面的截图中我们可以看到MySQL先读取了t_commodity_type表,但在rows一栏却扫描了15行数据,同时两张表分别执行了全表扫描(type为ALL),明显查询的效率降低了。因此除非是经验丰富的DBA,否则请谨慎使用straight_join子句。

时间: 2024-10-08 16:56:15

MySQL学习分享-->查询-->查询的分类的相关文章

MySQL学习笔记-子查询和连接

MySQL学习笔记-子查询和连接 使客户端进入gbk编码方式显示: mysql> SET NAMES gbk; 1.子查询 子查询的定义: 子查询(Subquery)是指出现在其他SQL语句内的SELECT子句. 例如:  SELECT * FROM t1 WHERE col1 = (SELECT col2 FROM t2); 其中SELECT * FROM t1 称为Outer Query / Outer Statement (外部查询) SELECT col2 FROM t2 , 被称为Su

MySQL学习分享-->查询-->子查询

子查询是指在查询语句中嵌套另一个查询语句. 子查询外面的查询部分被称为外部查询. 子查询必须包含括号. any.in.some any关键字必须与一个比较操作符一起使用,它的意思是"与子查询中返回列的数值进行逐一对比,只要其中一个数值比较为true,则返回true",我们来看一个查询实例, select id_temp from t_user_collect where commodity_id > any (select id from t_commodity); 得到如下结果

MySQL学习分享-->查询-->查询的原理

查询的原理 在一个查询中常包含下述子句: 1.select,2.distinct,3.join,4.on,5.from,6.where,7.having,8.group by,9.order by,10.limit 在查询执行过程中,每个子句按照一定的顺序被执行,每个子句被执行时都会产生一张虚拟表,只有最后一步生成的虚拟表才会返回给用户. 我们用实际的例子来讲解下查询的执行过程,先准备以下两张表: create table t_student( id bigint(20) not null au

MySql学习(三) —— 子查询(where、from、exists) 及 连接查询(left join、right join、inner join、union join)

同样的,使用goods表来练习子查询,表结构如下: 所有数据(cat_id与category.cat_id关联): 类别表: mingoods(连接查询时作测试) 一.子查询 1.where型子查询:把内层查询的结果作为外层查询的比较条件 1.1 查询id最大的一件商品(使用排序+分页实现) :mysql> SELECT goods_id,goods_name,shop_price FROM goods ORDER BY goods_id DESC LIMIT 1; 1.2 查询id最大的一件商

MySQL学习笔记1-----子查询

1.什么叫子查询? 通俗的讲就是查询中有查询,SQL语句中有多个select语句. 2.什么地方可以嵌入子查询? SELECT 列 (不在标准之内) FROM 表 (可以嵌入,作为表存在) WHERE 条件 (可以嵌入,作为条件存在) 3. 举例说明 假如此时有一个员工表emp,里面记录了员工的编号.名字.工作.工资及所在部门编号等信息 表结构如下: 查询工资最高的员工的信息 SELECT * FROM emp WHERE sal = (SELECT max(sal) FROM emp); //

Entity Framework with MySQL 学习笔记一(查询)

参考 : http://msdn.microsoft.com/en-us/data/jj574232.aspx EF 查询基本上有3中 默认是 Lazy Loading 特色是只有在需要数据的时候EF才会像数据库请求,它不会使用任何inner join 比如我们有一个产品,有很多颜色,(1对多) 那么我们想把每个产品和颜色统统选出来 using (EFDB db = new EFDB()) { var prods = db.prods.ToList(); //像数据库请求prods, 但是不会包

MySQL学习笔记(二)—查询

一.多表连接查询 新建两张表t_user.t_order.              1.内连接      返回满足条件的所有记录. (1)显式内连接      使用inner join关键字,在on子句中设定连接条件. SELECT u.id, u.name, u.address, o.orderno FROM t_user u INNER JOIN t_order o ON u.id = o.userid; 结果:          (2)隐式内连接      不包含inner join和o

MySQL学习笔记(3) - 查询服务器版本,当前时间,当前用户

1 SELECT VERSION(); --显示当前服务器版本 2 SELECT NOW(); --显示当前日期时间 3 SELECT USER(); --显示当前用户 MySQL中语句规范: 1.关键字和函数名大写.(小写也可识别) 2.数据库,表,字段全部小写. 3.每条语句分号结尾.

MySQL学习分享-->字符类型

字符类型 首先我们会讲到字符集的概念,字符集是指一些字符的集合,而字符编码是指一个字符的编码格式,因此两者的关系可以这样描述,例如:"使用Unicode编码的字符集",意思就是该字符集中的所有字符都是使用Unicode进行编码的. 接着说一下Unicode,它是一种字符编码,不是字符集,它为每种语言的每个字符设定了统一且唯一的二进制编码.在MySQL5.5及以上版本中支持ucs2.utf8.utf8mb4.utf16.utf32五种Unicode编码的字符集,而在MySQL5.5版本之