一、书写顺序
1 select[distinct] 2 from 3 join 4 on 5 where 6 group by 7 having 8 union 9 order by 10 limit
二、执行顺序
1 from 2 on 3 join 4 where 5 group by (可以使用select中的别名,后面的语句中都可以使用) 6 having 7 select 8 distinct 9 union 10 order by 11 limit
以上每个步骤都会产生一个虚拟表,该虚拟表被用作下一个步骤的输入。这些虚拟表对调用者(客户端应用程序或者外部查询)不可用。只有最后一步生成的表才会会给调用者。如果没有在查询中指定某一个子句,将跳过相应的步骤。
1、首先对from子句中的前两个表执行一个笛卡尔乘积(交叉联接),此时生成虚拟表 VT1(选择相对小的表做基础表);
2、应用on筛选器,on 中的逻辑表达式将应用到 VT1 中的各个行,筛选出满足on逻辑表达式的行,生成虚拟表 VT2;
3、如果是外连接,就将添加外部行;如果是左连接,就把左表在第二步中过滤的添加进来; 如果是右连接,就将右表在第二步中过滤掉的行添加进来,这样生成虚拟表 VT3 ;
如果 from 子句中的表数目多余两个表,那么就将VT3和第三个表连接从而计算笛卡尔乘积,生成虚拟表,该过程就是一个重复1-3的步骤,最终得到一个新的虚拟表 VT3;
4、对 VT3 应用 WHERE 筛选器,只有使为 true 的行才插入 VT4。
5、group by 子句将中的唯一的值组合成为一组,得到虚拟表VT5。如果应用了group by,那么后面的所有步骤都只能得到的VT5的列或者是聚合函数(count、sum、avg等)。原因在于最终的结果集中只为每个组包含一行;
6、应用cube或者rollup选项,为VT5生成超组,生成VT6.
7、应用having筛选器,生成VT7。having筛选器是第一个也是为唯一一个应用到已分组数据的筛选器
8、处理select子句。将VT7中的在select中出现的列筛选出来。生成VT8.
9、应用distinct子句,VT8中移除相同的行,生成VT9。事实上如果应用了group by子句那么distinct是多余的;
10、应用order by子句。按照order_by_condition排序VT9,此时返回的一个游标,而不是虚拟表。sql是基于集合的理论的,集合不会预先对他的行排序,它只是成员的逻辑集合,成员的顺序是无关紧要的。对表进行排序的查询可以返回一个对象,这个对象包含特定的物理顺序的逻辑组织。这个对象就叫游标。正因为返回值是游标,那么使用order by 子句查询不能应用于表表达式;
11、应用limit,从游标开始处选择指定数量或比例的行,生成表 TT11,并返回给用户。
原文地址:https://www.cnblogs.com/aland-1415/p/10875162.html