SQL Server调优系列 - 联合运算符总

前言

上两篇文章我们介绍了查看查询计划的方式，以及一些常用的连接运算符的优化技巧，本篇我们总结联合运算符的使用方式和优化技巧。

废话少说，直接进入本篇的主题。

技术准备

基于SQL Server2008R2版本，利用微软的一个更简洁的案例库（Northwind）进行解析。

一、联合运算符

所谓的联合运算符，其实应用最多的就两种：UNION ALL和UNION。

这两个运算符用法很简单，前者是将两个数据集结果合并，后者则是合并后进行去重操作，如果有过写T-SQL语句的码农都不会陌生。

我们来分析下这两个运算符在执行计划中的显示，举个例子

SELECT FirstName+N‘‘+LastName,City,Country FROM Employees
UNION ALL
SELECT ContactName,City,Country FROM Customers

就是上面这个图标了，这就是UNION ALL联合运算符的图标。

这个联合运算符很简单的操作，将两个数据集合扫描完通过联合将结果汇总。

我们来看一下UNION 这个运算符，例子如下

select City,Country from Employees
UNION
SELECT City,Country FROM Customers

我们可以看到，UNION 运算符是在串联运算符之后发生了一个Distinct Sort排序操作，经过这个操作会将结果集合中的重复值去掉。

我们一直强调：大数据表的排序是一个非常耗资源的动作！

所以，到这里我们已经找到了可优化的选项，去掉排序，或者更改排序方式。

替换掉Distinct Sort排序操作的方式就是哈序聚合。Distinct Sort排序操作需要的内存和去除重复之前数据集合的数据量成正比，而哈希聚合需要的内存则是和去除重复之后的结果集成正比！

所以如果数据行中重复值很多，那么相比而言通过哈希聚合所消耗的内存会少。

我们来举个例子

select ShipCountry from Orders
UNION
SELECT ShipCountry FROM Orders

这个例子其实没啥用处，这里就是为了演示，我们来看一下结果

我们知道，这张表里这个ShipCountry是存在大面积重复值的，所以采用了哈希匹配来去重操作是最优的方式。

其实，相比哈希匹配连接还有一种更轻量级的去重的连接方式：合并连接

上一篇我已经分析了这个连接方法，用于两个数据集的连接方式，这里其实类似，应用前都必须先将原结果集合排序！

我们知道优化的方式可以采用建立索引来提高排序速度。

我们来重现这种去重方式，我们新建一个表，然后建立索引，代码如下

--新建表
SELECT EmployeeID,FirstName+N‘ ‘+LastName AS ContactName,City,Country
INTO NewEmployees
FROM Employees
GO
--添加索引
ALTER TABLE NewEmployees ADD CONSTRAINT PK_NewEmployees PRIMARY KEY(EmployeeID)
CREATE INDEX ContactName ON NewEmployees(ContactName)
CREATE INDEX ContactName ON CUSTOMERS(ContactName)
GO
--新建查询，这里一定要加上一个显示的Order by才能出现合并连接去重
SELECT ContactName FROM NewEmployees
UNION ALL
SELECT ContactName FROM Customers
ORDER BY ContactName

我们采用索引扫描的方式可以避免显式的排序操作。

我们将UNION ALL改成UNION，该操作将会对两个数据集进行去重操作。

--新建查询，这里一定要加上一个显示的Order by才能出现合并连接去重
SELECT ContactName FROM NewEmployees
UNION
SELECT ContactName FROM Customers
ORDER BY ContactName

这里我们知道UNION操作会对结果进行去重操作，上面应用了流聚合操作，流聚合一般应用于分组操作中，当然这里用它进行了分组去重。

在我们实际的应用环境中，最常用的方式还是合并连接，但是有一种情况最适合哈希连接，那就是一个小表和大表进行联合操作，尤其适合哪种大表中存在大量重复值的情况下。

哈希算法真是个好东西！

参考文献

微软联机丛书逻辑运算符和物理运算符引用
参照书籍《SQL.Server.2005.技术内幕》系列

结语

此篇文章先到此吧，简短一点，便于理解掌握，本篇主要介绍了查询计划中的联合操作运算符，下一篇我们分析SQL Server中的并行运算，在多核超线程云集的今天，来看SQL Server如何利用并行运算来最大化的利用现有硬件资源提升性能，有兴趣可提前关注，关于SQL Server性能调优的内容涉及面很广，后续文章中依次展开分析。

SQL Server这个软件一旦深入进去，你会发现它真的非常深，基本可以用深不见底来描述，如果想研究里面的性能调优这块，可以关注本系列内容，我们一起研究！

而且到现在还有很多人对SQL Server这套产品有误解，或者说观点有待纠正，以前就遇到过客户直接当我面大谈神马SQL Server导入数据一多就宕机了....

神马SQL Server只能做小数据量的应用...神马不如Oracle云云....!!!

还有一部分童鞋单纯的认为SQL Server是小儿科，没啥技术含量...简单的很....

关于这些观点，我不想吐槽啥，我只想让那些真正了解SQL Server的朋友一起来为SQL Server证明点什么。

时间： 2024-11-09 05:06:51

SQL Server调优系列 - 联合运算符总的相关文章

SQL Server调优系列 - 常用运算符总结

前言上一篇我们介绍了如何查看查询计划,本篇将介绍在我们查看的查询计划时的分析技巧,以及几种我们常用的运算符优化技巧,同样侧重基础知识的掌握. 通过本篇可以了解我们平常所写的T-SQL语句,在SQL Server数据库系统中是如何分解执行的,数据结果如何通过各个运算符组织形成的. 技术准备基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析. 一.数据连接数据连接是我们在写T-SQL语句的时候最常用的,通过两个表之间关联获取想要的数据. SQL

SQL Server调优系列基础篇（联合运算符总结）

前言上两篇文章我们介绍了查看查询计划的方式,以及一些常用的连接运算符的优化技巧,本篇我们总结联合运算符的使用方式和优化技巧. 废话少说,直接进入本篇的主题. 技术准备基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析. 一.联合运算符所谓的联合运算符,其实应用最多的就两种:UNION ALL和UNION. 这两个运算符用法很简单,前者是将两个数据集结果合并,后者则是合并后进行去重操作,如果有过写T-SQL语句的码农都不会陌生. 我们来分析下

SQL Server调优系列玩转篇二（如何利用汇聚联合提示（Hint）引导语句运行）

原文:SQL Server调优系列玩转篇二(如何利用汇聚联合提示(Hint)引导语句运行) 前言上一篇我们分析了查询Hint的用法,作为调优系列的最后一个玩转模块的第一篇.有兴趣的可以点击查看:SQL Server调优系列玩转篇(如何利用查询提示(Hint)引导语句运行) 本篇继续玩转模块的内容,同样,还是希望扎实掌握前面一系列的内容,才进入本模块的内容分析. 闲言少叙,进入本篇的内容. 技术准备数据库版本为SQL Server2012,利用微软的以前的案例库(Northwind)进行分析,

SQL Server调优系列基础篇（常用运算符总结）

原文:SQL Server调优系列基础篇(常用运算符总结) 前言上一篇我们介绍了如何查看查询计划,本篇将介绍在我们查看的查询计划时的分析技巧,以及几种我们常用的运算符优化技巧,同样侧重基础知识的掌握. 通过本篇可以了解我们平常所写的T-SQL语句,在SQL Server数据库系统中是如何分解执行的,数据结果如何通过各个运算符组织形成的. 技术准备基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析. 一.数据连接数据连接是我们在写T-SQL语

SQL Server调优系列基础篇（并行运算总结）

原文:SQL Server调优系列基础篇(并行运算总结) 前言上三篇文章我们介绍了查看查询计划的方式,以及一些常用的连接运算符.联合运算符的优化技巧. 本篇我们分析SQL Server的并行运算,作为多核计算机盛行的今天,SQL Server也会适时调整自己的查询计划,来适应硬件资源的扩展,充分利用硬件资源,最大限度的提高性能. 闲言少叙,直接进入本篇的正题. 技术准备同前几篇一样,基于SQL Server2008R2版本,利用微软的一个更简洁的案例库(Northwind)进行解析. 一.并

SQL Server调优系列进阶篇（查询语句运行几个指标值监测）

原文:SQL Server调优系列进阶篇(查询语句运行几个指标值监测) 前言上一篇我们分析了查询优化器的工作方式,其中包括:查询优化器的详细运行步骤.筛选条件分析.索引项优化等信息. 本篇我们分析在我们运行的过程中几个关键指标值的检测. 通过这些指标值来分析语句的运行问题,并且分析其优化方式. 通过本篇我们可以学习到调优中经常利用的几个利器! 废话少说,开始本篇的正题. 技术准备数据库版本为SQL Server2008R2,利用微软的一个更简洁的案例库(Northwind)进行分析. 利器一

SQL Server调优系列玩转篇三（利用索引提示（Hint）引导语句最大优化运行）

前言本篇继续玩转模块的内容,关于索引在SQL Server的位置无须多言,本篇将分析如何利用Hint引导语句充分利用索引进行运行,同样,还是希望扎实掌握前面一系列的内容,才进入本模块的内容分析. 闲言少叙,进入本篇的内容. 技术准备数据库版本为SQL Server2012,利用微软的以前的案例库(Northwind)进行分析,部分内容也会应用微软的另一个案例库AdventureWorks. 相信了解SQL Server的朋友,对这两个库都不会太陌生. 一.并行Hint提示 (MAXDOP N

SQL Server调优系列玩转篇（如何利用查询提示（Hint）引导语句运行）

前言前面几篇我们分析了关于SQL Server关于性能调优的一系列内容,我把它分为两个模块. 第一个模块注重基础内容的掌握,共分6篇文章完成,内容涵盖一系列基础运算算法,详细分析了如何查看执行计划.掌握执行计划优化点,并一一列举了日常我们平常所写的T-SQL语句所会应用的运算符.我相信你平常所写的T-SQL语句在这几篇文章中都能找到相应的分解运算符. 第二个模块注重SQL Server执行T-SQL语句的时候一些内幕解析,共分为5篇文章完成,其中包括:查询优化器的运行方式.运行时几个优化指标值

SQL Server调优系列进阶篇（深入剖析统计信息）

前言经过前几篇的分析,其实大体已经初窥到SQL Server统计信息的重要性了,所以本篇就要祭出这个神器了. 该篇内容会很长,坐好板凳,瓜子零食之类... 不废话,进正题技术准备数据库版本为SQL Server2008R2,利用微软的以前的案例库(Northwind)进行分析,部分内容也会应用微软的另一个案例库AdventureWorks 相信了解SQL Server的朋友,对这两个库都不会太陌生. 概念理解关于SQL Server中的统计信息,在联机丛书中是这样解释的查询优化的统计信