深入具体解释SQL中的Null

NULL 在计算机和编程世界中表示的是未知,不确定。尽管中文翻译为 “空”, 但此空(null)非彼空(empty)。 Null表示的是一种未知状态。未来状态,比方小明兜里有多少钱我不清楚,但也不能肯定为0,这时在计算机中就使用Null来表示未知和不确定。

尽管熟练掌握SQL的人对于Null不会有什么疑问,但总结得非常全的文章还是非常难找,看到一篇英文版的, 感觉还不错。

Tony Hoare 在1965年发明了 null 引用, 并觉得这是他犯下的“几十亿美元的错误”. 即便是50年后的今天, SQL中的 null 值还是导致很多常见错误的罪魁祸首.

我们一起来看那些最令人震惊的情况。

Null不支持大小/相等推断

以下的2个查询,无论表 users 中有多少条记录,返回的记录都是0行:

select * from users where deleted_at = null;

– result: 0 rows

select * from users where deleted_at != null;

– result: 0 rows

怎么会这样子? 一切仅仅由于 null 是表示一种“未知”的类型。也就是说。用常规的比較操作符(normal conditional operators)来将 null 与其它值比較是没有意义的。 Null 也不等于 Null(近似理解: 未知的值不能等于未知的值。两者间的关系也是未知。否则数学和逻辑上就乱套了)。

注意: 以下的SQL适合于MySQL,假设是Oracle,你须要加上 … from dual;

select null > 0;

– result: null

select null < 0;

– result: null

select null = 0;

– result: null

select null = null;

– result: null

select null != null;

– result: null

将某个值与 null 进行比較的正确方法是使用 is keyword, 以及 is not 操作符:

select * from users
where deleted_at is null;

– result: 全部未被删除的 users

select * from users
where deleted_at is not null;

– result: 全部被标记为删除的 users

假设想要推断两列的值是否不相同,则能够使用 is distinct from:

select * from users
where has_address is distinct from has_photo

– result: 地址(address)或照片(photo)两者仅仅有其一的用户

not in 与 Null

子查询(subselect)是一种非常方便的过滤数据的方法。比如,假设想要查询没有不论什么包的用户,能够编写以下这样一个查询:

select * from users
where id not in (select user_id from packages)

但此时假若 packages 表中某一行的 user_idnull 的话。问题就来了: 返回结果是空的! 要理解为什么会发生这样的古怪的事情, 我们须要理解SQL编译器到底干了些什么. 以下是一个更简单的演示样例:

select * from users
where id not in (1, 2, null)

这个SQL语句会被转换为:

select * from users
where id != 1 and id != 2 and id != null

我们知道。id != null 结果是个未知值, null. 而随意值和 null 进行 and 运算的结果都是 null, 所以相当于没有其它条件. 那么出这样的结果的原因就是 null 的逻辑值不为 true.

假设条件调换过来, 查询结果就没有问题。 如今我们查询有package的用户.

select * from users
where id in (select user_id from packages)

相同我们能够使用简单的样例:

select * from users
where id in (1, 2, null)

这条SQL被转换为:

select * from users
where id = 1 or id = 2 or id = null

由于 where 子句中是一串的 or 条件,所以当中某个的结果为 null 也是无关紧要的。非真(non-true)值并不影响子句中其它部分的计算结果,相当于被忽略了。

Null与排序

在排序时, null 值被觉得是最大的. 在降序排序时(descending)这会让你非常头大,由于 null值排在了最前面。

以下这个查询是为了依据得分显示用户排名, 但它将没有得分的用户排到了最前面!

select name, points
from users
order by 2 desc;

– points 为 null 的记录排在全部记录之前!

解决这类问题有两种思路。

最简单的一种是用 coalesce 消除 null的影响:

– 在输出时将 null 转换为 0 :

select name, coalesce(points, 0)
from users
order by 2 desc;

– 输出时保留 null, 但排序时转换为 0 :

select name, points
from users
order by coalesce(points, 0) desc;

另一种方式须要数据库的支持,指定排序时将 null 值放在最前面还是最后面:

select name, coalesce(points, 0)
from users
order by 2 desc nulls last;

当然, null 也能够用来防止错误的发生,比方处理除数为0的数学运算错误。

被 0 除

除数为0是一个非常 egg-painfull 的错误。昨天还执行得好好的SQL。突然被0除一下子就出错了。一个经常使用的解决方法是先用 case 语句推断分母(denominator)是否为0,再进行除法运算。

select case when num_users = 0 then 0
else total_sales/num_users end;

case 语句的方式事实上非常难看,并且分母被反复使用了。

假设是简单的情况还好,假设分母是个非常复杂的表达式,那么悲剧就来了: 非常难读,非常难维护和改动,一不小心就是一堆BUG.

这时候我们能够看看 null 的优点. 使用 nullif 使得分母为0时变成 null. 这样就不再报错, num_users = 0 时返回结果变为 null.

select total_sales/nullif(num_users, 0);

nullif 是将其它值转为 null, 而Oracle的 nvl 是将 null 转换为其它值。

假设不想要 null,而是希望转换为 0 或者其它数, 则能够在前一个SQL的基础上使用 coalesce函数:

select coalesce(total_sales/nullif(num_users, 0), 0);

null 再转换回0

Conclusion

Tony Hoare 或许会懊悔自己的错误, 但至少 null 存在的问题非常easy地就攻克了. 那么快去练练新的大招吧。从此远离 null 挖出来的无效大坑(nullifying)!

原文链接: Understanding SQL’s Null

原文日期: 2015年03月17日

翻译日期: 2015年03月18日

翻译人员: 铁锚 http://blog.csdn.net/renfufei

时间: 2024-10-23 13:31:51

深入具体解释SQL中的Null的相关文章

SQL中的Null深入研究分析

虽然熟练掌握SQL的人对于Null不会有什么疑问,但总结得很全的文章还是很难找,看到一篇英文版的, 感觉还不错. Tony Hoare 在1965年发明了 null 引用, 并认为这是他犯下的"几十亿美元的错误". 即便是50年后的今天, SQL中的 null 值还是导致许多常见错误的罪魁祸首. 我们一起来看那些最令人震惊的情况. Null不支持大小/相等判断 下面的2个查询,不管表 users 中有多少条记录,返回的记录都是0行: select * from users where

深入详解SQL中的Null

NULL 在计算机和编程世界中表示的是未知,不确定.虽然中文翻译为 "空", 但此空(null)非彼空(empty). Null表示的是一种未知状态,未来状态,比如小明兜里有多少钱我不清楚,但也不能肯定为0,这时在计算机中就使用Null来表示未知和不确定. 虽然熟练掌握SQL的人对于Null不会有什么疑问,但总结得很全的文章还是很难找,看到一篇英文版的, 感觉还不错. Tony Hoare 在1965年发明了 null 引用, 并认为这是他犯下的"几十亿美元的错误"

SQL中的NULL值

除is [not] null之外,空值不满足任何查找条件.–如果null参与算术运算,则该算术表达式的值为null.–如果null参与比较运算,则结果可视为false.在SQL-92中可看成unknown.–如果null参与聚集运算,则除count(*)之外其它聚集函数都忽略null.   例:select    sum(SAL)           from     PROF   例:select    count(*)           from     PROF– 详细分析 SQL中的N

SQL中的null

对Oracle SQL中的null小结如下: 1.1       null ? null 值计算的结果仍是null ? null 是一个未分配的.未知的,或不适用的值 ? null不是0,也不是空格 1.1.1       null值的运算 null参数的算术表达式的结果仍然为null SQL>  select '*'||1/null||'*' res1,'*'||1*null||'*' res2, '*'||(1-null)||'*' res3 from dual; RE RE RE -- -

SQL 中【NULL】和【无】烦躁的问题

很烦躁,烦躁的很,总结一下. 先简单的说下: NULL   : 不确定的东西 无       :没有东西 复杂的见下文....... 一 .null值 下面举个最简单的例子,平常工作当中肯定比这个sql复杂的多,在这只是把这个易错点呈现出来,他可能是一个复杂sql出错的小的 不容易被发现的一个问题. 上面是一个很简单表的所有数据.area_num 区域编码 area_name 区域名称 delflag 有无效标识 1有效 0无效(其中淮北 和宣城的delflag为null). 现在想找出有效的那

sql 中的NULL小问题 ,大bug

今天在写退款的的SQL的时候遇到一个问题,直接导致之前记录的所有操作日志,清空了,还好自己有看数据的习惯,下面贴上代码 1 UPDATE TradeUser 2 SET 3 UserScore=@UserScore 4 Remark=ISNULL(Remark,'')+' '+@UserName +' 手动取消付款,退还积分' 5 WHERE UserId=@UserID 执行这句SQL后,备注直接清空,百思不得其解,找不到原因.其实原因很简单,传入的@UserName是NULL,导致字符串和N

SQL 语句中关于 NULL 的那些坑

问题描述 今天在跟进公司内部测试平台线上问题的时候,发现一个忽略已久的问题. 为了简化问题描述,将其进行了抽象. 有一张数据表qms_branch,里面包含了一批形式如下所示的数据: id name types 1 dashboard_trunk dashboard 2 monkey_trunk monkey 3 dashboard_projects_10_9_9 dashboard 4 performance_trunk   5 performance_projects_10_9_8 perf

SQL中IS NOT NULL与!=NULL的区别

平时经常会遇到这两种写法:IS NOT NULL与!=NULL.也经常会遇到数据库有符合条件!=NULL的数据,但是返回为空集合.实际上,是由于对二者使用区别理解不透彻. 默认情况下,推荐使用 IS NOT NULL去做条件判断,因为SQL默认情况下对WHERE XX!= Null的判断会永远返回0行,却不会提示语法错误. 这是为什么呢? SQL Server文档中对Null值的比较运算定义了两种规则,如在SQL Server 2000中: 规则一是是ANSISQL(SQL-92)规定的Null

SQL中关键字的执行顺序

作为一个SQL新手,看到每种不熟悉的关键字时已经够迷茫了,可往往见到的语句关键字顺序还是各种各样,太难理解了.网上搜索了两篇文章,总结一下: 关于Sql关键字SELECT FROM GROUP ORDER 等的执行顺序问题的解释 SQL 中 SELECT 语句的执行顺序 以及 十步完全理解SQL 的第二步. 总结: 标准的 SQL 的解析顺序为:   (1).FROM 子句, 组装来自不同数据源的数据 包括各种JOIN和ON (2).WHERE 子句, 基于指定的条件对记录进行筛选   (3).