Merge:探讨on子句和when not match子句的陷阱

在细节上,体现编程的修养。每一位大师,master,其基础必定夯实。废话不多说,直接上干货,Merge子句用于对两个数据表执行数据同步,On子句指定匹配(when matched)条件,When子句指定额外的过滤条件和数据更新逻辑。源表(Source Table)和靶表(Targe Table)的数据行能够匹配成功,这意味着on子句和when match条件都被满足,进入到when matched子句定义的更新代码中,执行数据同步操作;如果不满足on子句,那么必须深入理解不匹配(when not matched)子句的条件,否则,很容易出错。首先查看MSDN对On子句的定义:

ON <merge_search_condition>  Specifies the conditions on which source_table_ is joined with target_table to determine where they match.

也就是说,如果两个数据行满足on子句条件,那么数据处理程序跳转到when matched子句;如果两个数据行不满足on子句,那么数据处理程序跳转到when not matched子句。如果在on子句中只指定源表列和靶表列之间的匹配关系,那么同步操作一般不会出现“意外"的问题,意外是指符合设计者的预期。一旦在on子句中试图过滤靶表或源表的数据行,那么,再执行数据同步可能出现异常结果,出现不符合设计者预期的行为。实际上,MSDN已经明确给出提示,不要忽略这个提示,不然,你很可能已经挖了坑而不自知:

It is important to specify only the columns from the target table that are used for matching purposes. That is, specify columns from the target table that are compared to the corresponding column of the source table. Do not attempt to improve query performance by filtering out rows in the target table in the ON clause, such as by specifying AND NOT target_table.column_x = value. Doing so may return unexpected and incorrect results.

在开始测试when not matched子句的陷进之前,使用以下脚本创建示例数据:

create table dbo.dt_source
(
    ID int,
    Code int
)
go
create table dbo.dt_target
(
    ID int,
    Code int
)
go
insert into dbo.dt_source
(
ID,
Code
)
values(1,1),(2,1),(3,2),(4,2),(5,0)
GO
insert into dbo.dt_target
(
ID,
Code
)
values(1,1),(6,4)
GO

一,在on子句中过滤源表

1,在Merge的On子句中,使用额外的筛选条件(s.Code>0)对SourceTable进行过滤

对源表进行过滤,初衷是为了将SourceTable中Code>0的数据作为数据源同步到TargetTable,但是,在Merge命令的On子句中,s.Code>0只是一个匹配条件,用于when matched子句;然而,对于when not matched子句,是指不满足on条件:t.id=s.id and s.Code>0 ,这意味着when not matched匹配的查询条件是: t.id<>s.id or s.ID<=0,表达的逻辑是:s.id 和任意一个 t.id 都不相等, 或 s.ID<=0,这使得源表dbo.dt_source中Code<=0的数据行都满足when not matched子句的条件,被插入到dbo.dt_target中。

;merge dbo.dt_target as t
using dbo.dt_source as s
    on t.id=s.id and s.Code>0
when matched
then update
set t.code=s.code
when not matched
then insert
(
ID,
Code
)
values
(
s.ID,
s.Code
);

查看TargetTable,Code=0的数据被插入到TargeTable表中,靶表的数据如下:

2,正确的写法:不要试图在on子句中过滤源表

在使用Merge命令同步数据时, 如果要过滤源表,正确的做法是把筛选条件放在所有的when子句中,包括When matched子句和when not matched子句。对on子句添加对源表的过滤条件,在when matched子句中,正常过滤源表,而在when not matched子句,会出现异常。

;merge dbo.dt_target as t
using dbo.dt_source as s
    on t.id=s.id when matched and s.Code>0
then update
set t.code=s.code
when not matched and s.Code>0
then insert
(
ID,
Code
)
values
(
s.ID,
s.Code
);

二,在on子句中过滤靶表(Target Table)

清空测试数据表,插入测试数据

insert into dbo.dt_source
(
ID,
Code
)
values(1,-1),(2,1),(3,2),(4,2),(5,0),(6,7)
GO
insert into dbo.dt_target
(
ID,
Code
)
values(1,1),(6,4)
GO

1,在on子句中对靶表进行过滤
在on子句中指定匹配条件:on t.id=s.id and t.Code<4,指定的时when matched的匹配条件,对于when not matched子句,匹配条件是:t.id<>s.id or t.Code>=4,对于源表数据行Row(6,7),不满足t.id<>s.id,因为存在TargetTableRow(6,4),但是满足 or 的另外一个条件  t.Code>=4, 所以,when not matched语句逻辑结果是true,执行insert语句。

;merge dbo.dt_target as t
using dbo.dt_source as s
    on t.id=s.id and t.Code<4
when matched
then update
set t.code=s.code
when not matched
then insert
(
ID,
Code
)
values
(
s.ID,
s.Code
);

TargetTable的结果集如下图,包括(6,7)

2,分析陷进

这或许是你想要的结果,或许,你的本意是不希望 t.Code>=4的数据行插入到靶表中,如果merge子句要实现的业务逻辑是后者,那么数据同步将出现异常,所以一定要深刻理解when not matched子句的匹配条件,推荐的做法是:不要试图在on子句中过滤源表或靶表,如果必须要过滤数据行,那么请在每个when子句(when matched和when not matched)中,添加额外的and 过滤条件。

时间: 2024-11-02 15:33:26

Merge:探讨on子句和when not match子句的陷阱的相关文章

1. 安装Oracle,配置环境 2. 实现查询From子句 3. 实现查询where子句 4. 实现查询order by子句

一.环境安装1. 登录:以管理员身份登录 sqlplus 登录名/密码 管理员身份登录:sqlplus system/1234562. 登录后,导入案例.下载scott.sql文件,执行下面一行的命令 SQL>@"E:\兄弟连文档\oracle\java 19\day01\script\scott.sql"; 此时我们拥有非管理员的用户:scott3. 激活scott的账号,激活用scott可登录 alter user scott identified by tiger; alt

Neo4j 第三篇:Cypher查询入门

Neo4j使用Cypher查询图形数据,Cypher是描述性的图形查询语言,语法简单,功能强大,由于Neo4j在图形数据库家族中处于绝对领先的地位,拥有众多的用户基数,使得Cypher成为图形查询语言的事实上的标准.本文作为入门级的教程,我不会试图分析Cypher语言的全部内容,本文的目标是循序渐进地使用Cypher语言执行简单的CRUD操作,为了便于演示,本文在Neo4j Browser中执行Cypher示例代码.以下图形包含三个节点和两个关系,本文会一步一步讲解如何利用Cypher语言创建以

TSQL Merge 用法

TSQL的Merge语句不仅能够同步数据,而且能够将更新的数据输出. 一,语法 1,when match子句要求Target表中一个数据行只能被更新一次 If UPDATE is specified in the <merge_matched> clause, and more than one row of <table_source>matches a row in target_table based on <merge_search_condition>, SQ

Oracle中MERGE语句的使用

Oracle在9i引入了merge命令, 通过这个merge你能够在一个SQL语句中对一个表同时执行inserts和updates操作. 当然是update还是insert是依据于你的指定的条件判断的,Merge into可以实现用B表来更新A表数据,如果A表中没有,则把B表的数据插入A表. MERGE命令从一个或多个数据源中选择行来updating或inserting到一个或多个表 语法如下 MERGE INTO [your table-name] [rename your table her

merge into

动机: 想在Oracle中用一条SQL语句直接进行Insert/Update的操作. 说明: 在进行SQL语句编写时,我们经常会遇到大量的同时进行Insert/Update的语句 ,也就是说当存在记录时,就更新(Update),不存在数据时,就插入(Insert). merge into 是特有的功能,相当于在 MSSQL中的 if exists(...) update table else Insert into table. merge into 语法不仅没有if exists语法啰嗦,而且

Oracle中Merge into用法总结

MERGE语句是Oracle9i新增的语法,用来合并UPDATE和INSERT语句.通过MERGE语句,根据一张表或子查询的连接条件对另外一张表进行查询,连接条件匹配上的进行UPDATE,无法匹配的执行INSERT.这个语法仅需要一次全表扫描就完成了全部工作,执行效率要高于INSERT+UPDATE. 语法: MERGE INTO [your table-name] [rename your table here] USING ( [write your query here] )[rename

Multi Match Query

Multi Match Query multi_match查询建议在match query之上,并允许多字段查询: GET /_search { "query": { "multi_match" : { "query": "this is a test", [1] "fields": [ "subject", "message" ] [2] } } } [1] 查询字

说一下output子句

Output子句日常灰常有用,而且用的地方也挺多,但是确好多时候被我们忽视,今天我就也简单扫盲一下这个语句的用法. Output子句 返回受 INSERT.UPDATE.DELETE 或 MERGE 语句影响的各行中的信息,或返回基于受这些语句影响的各行的表达式. 这些结果可以返回到处理应用程序,以供在确认消息.存档以及其他类似的应用程序要求中使用. 也可以将这些结果插入表或表变量. 另外,您可以捕获嵌入的 INSERT.UPDATE.DELETE 或 MERGE 语句中 OUTPUT 子句的结

db2 merge update

DB2 Merge 语句的作用非常强大,它可以将一个表中的数据合并到另一个表中,在合并的同时可以进行插入.删除.更新等操作.我们还是先来看个简单的例子吧,假设你定义了一个雇员表(employe),一个经理表(manager),如下所示: 关键字.参数 into子句 在into子句中指定所要修改或者插入数据的目标表 using子句 在using子句中指定用来修改或者插入的数据源.数据源可以是表.视图或者一个子查询语句. on子句 在on子句中指定执行插入或者修改的满足条件. when matche