SQL反模式学习笔记5 外键约束【不用钥匙的入口】

2014-10-11 14:53:20

目标:简化数据库架构

一些开发人员不推荐使用引用完整性约束,可能不使用外键的原因有一下几点:

1、数据更新有可能和约束冲突;

2、当前的数据库设计如此灵活,以至于不支持引用完整性约束;

3、数据库为外键建立的索引会影响性能;

4、当前使用的数据库不支持外键。比如MySQL的MyISAM存储引擎,或者比SQLite3.6.19早的版本;

5、定义外键的语法并不简单,还需要查阅。

反模式:无视约束,即不使用约束

省略外键约束能使得数据库设计更加简单、灵活,或者执行更加高效,但是你不得不在其他方面付出相应的代价,

必须增加额外的代码来手动维护引用完整性。

1、假设无暇代码:要避免在没有外键约束的情况下产生引用的不完整状态,需要再任何改变生效前执行额外的Select查询,

以此来确保这些改变不会导致引用错误。比如在查询一条记录之前,需要检查对应的被引用记录是否存在。

2、检查错误:开发人员使用外部脚本来检查错误的数据。

3、修改代码时,无法保证系统中的所有部分都被同时修改。

4、可能有些用户直接操作了数据库,修改或删除被引用的字段值,导致其他表引用发生未知错误;

而且你不能确定所有的应用程序或者脚本在访问数据库时所做的操作都是正确合理的。

5、当你Update更新一条被其他记录依赖的记录时,在没有更新父记录前,你不能更新子记录,

而且也不能在更新父记录前更新子记录。你需要同步执行两边的更新,但是使用2个独立的更新语句是不显示的。

如何识别反模式:当出现以下情况时,可能是反模式

1、我要怎么写这个查询来检查一个值是否没有被同时存在2张表中?(通常这样的需求是为了查找那些孤立的行数据)

2、有没有一种简单的方法来判断在一张表中的数据是否也在第二张表中存在?

(这么做是用来确认父记录切实存在。外键会自动完成这些,并且外键会使用这父表的索引尽可能的高效完成)

3、有人说不要用外键,外键影响数据库效率。

合理使用反模式:

       如果数据库产品不支持外键约束功能,则不得不使用别的方法来保持引用完整性,比如使用监控脚本。

同样也存在一些极度灵活的数据库设计,外键无法用来表示其对应的关系。

解决方案:声明约束

       1、通过使用外键来确保应用完整性;

使用约束时:(1)数据库本身会拒绝所有不合理的改变,无论这个改变是通过什么方式造成的。

(2)能够避免编写不必要的代码,同时还能确保一旦修改了数据库中的内容,所有的代码依旧能够用同样的方式执行。

(3)外键的特性:级联更新,比如:On Update Cascade、On Delete Restrict等。

在执行更新和删除2个操作中的任意1个是,数据库都会自动修改多张表中的数据,

外键的引用状态在操作之前和之后都保持完好。

2、外键约束的确需要多那么一点额外的系统开销,但相比于其他的一些选择,外键确实更高效一点:

(1)不需要在更新或删除记录前执行Select检查;

(2)在同步修改时不需要再锁住整张表;

(3)不再需要执行定期监控脚本来修正不可避免的孤立数据。

时间: 2024-11-08 21:41:46

SQL反模式学习笔记5 外键约束【不用钥匙的入口】的相关文章

SQL反模式学习笔记22 伪键洁癖,整理数据

2014-10-17 16:31:50 目标:整理数据,使不连续的主键Id数据记录变的连续. 反模式:填充断档的数据空缺. 1.不按照顺序分配编号 在插入新行时,通过遍历表,找到的第一个未分配的主键编号分配给新行,来代替原来自动分配的伪主键机制. 使用Select Max(Id) + 1 这种查询语句,会出现并发访问的问题. 2.为现有数据行重新编号:通常做法是找到主键最大的行,然后用最小的未被使用的值来更新它. 缺点:(1)SQL语句比较麻烦:   (2)必须同时更新所有引用了你重新分配了主键

SQL反模式学习笔记7 多态关联

2014-10-13 09:50:54 目标:引用多个父表 反模式:使用多用途外键.这种设计也叫做多态关联,或者杂乱关联. 多态关联和EAV有着相似的特征:元数据对象的名字是存储在字符串中的. 在多态关联中,父表的名字是存储在Issue_Type单独一列中,有时候这样的设计被称作:混合数据与原数据. 查询示例: select * from A as a               left join B as b on a.xId=b.Id and a.xType='b'            

SQL反模式学习笔记4 需要ID,建立主键规范

2014-10-11 10:23:31 目标:建立主键规范 反模式:每个数据库中的表都需要一个伪主键Id 在表中,需要引入一个对于表的域模型无意义的新列来存储一个伪值,这一列被用作这张表的主键, 从而通过它来确定表中的一条记录,即便其他的列允许出现适当的重复项.这种类型的主键列我们通常称其为“伪主键”或者“代理键”. 1.冗余键值:如果存在一个逻辑上更为自然的主键并且也满足unique约束,那么id就多余了: 2.允许重复项:伪主键本身确保了表的数据不会存在重复项,所以也就无法避免表中的其它数据

SQL反模式学习笔记11 限定列的有效值

2014-10-14 08:46:07 目标:限定列的有效值,将一列的有效字段值约束在一个固定的集合中.类似于数据字典. 反模式:在列定义上指定可选值 1. 对某一列定义一个检查约束项,这个约束不允许往列中插入或者更新任何会导致约束失败的值:            create table Bugs(status varchar(20) check(status in('new','in progress','fixed'))). 2.使用域或者用户自定义类型(UDT)等方法.        

SQL反模式学习笔记6 支持可变属性【实体-属性-值】

2014-10-11 17:21:31 目标:支持可变属性 反模式:使用泛型属性表.这种设计成为实体-属性-值(EAV),也可叫做开放架构.名-值对. 优点:通过增加一张额外的表,可以有以下好处 (1)表中的列很少: (2)新增属性时,不需要新增列.不会影响现有表的结构: (3)存储的字段内容不会为空值. 缺点:(1)查询语句变得更加复杂: (2)使用EAV设计后,需要放弃传统的数据库设计所带来的方便之处,比如:无法保障数据完整性: (3)无法使用SQL的数据类型,比如对日期.金钱等格式内容都只

SQL反模式学习笔记8 多列属性

2014-10-13 10:32:12 目标:存储多值属性 反模式:创建多个列.比如一个人具有多个电话号码.座机号码.手机号码等. 1.查询:多个列的话,查询时可能不得不用IN,或者多个OR: 2.添加.删除时确保唯一性.判断是否有值:这些都很麻烦: 3.字段的列数无法确定具体数量. 如何识别反模式:当出现以下情况时,可能是反模式 1.应该支持的动态列的数量是多少? 2.如何才能在SQL查询中同时查询多列? 合理使用反模式: 在默写情况下,一个属性可能有固定数量的候选值,并且他们的存储位置和顺序

SQL反模式学习笔记3 单纯的树

2014-10-11 08:59:48 在树形结构中,实例被称为节点.每个节点都有多个子节点与一个父节点. 最上层的节点叫做根(root)节点,它没有父节点. 最底层的没有子节点的节点叫做叶(leaf). 中间的节点简单地称为非叶节点(nonleaf). 目标:分成存储于查询,比如:系统字典.组织机构.省份区域等树形结构数据或者以层级方式组织的数据. 反模式:总是依赖父节点,邻接表. 最简单的实现方式是添加ParentId字段,引用同一张表的主键ID. 邻接表维护树比较方便,但是查询很笨拙,如果

SQL反模式学习笔记16 使用随机数排序

2014-10-15 10:06:48 目标:随机排序,使用高效的SQL语句查询获取随机数据样本. 反模式:使用RAND()随机函数 SELECT * FROM Employees AS e ORDER BY RAND() Limit 1 缺点:无法利用索引,每次选择的时候都不同且不可预测.进行全表遍历,性能极差. 如何识别反模式:当出现以下情况时,可能是反模式 1.在SQL中,返回一个随机行速度非常慢: 2.要获取所有的记录然后随机一个.要如何增加程序可使用的内存大小? 3.有些列出现的频率比

SQL反模式学习笔记13 使用索引

2014-10-14 10:29:53 目标:优化性能 改善性能最好的技术就是在数据库中合理地使用索引.  索引也是数据结构,它能使数据库将指定列中的某个值快速定位在相应的行. 反模式:无规划的使用索引 1.不使用索引或索引不足 2.使用了太多的索引或一些无效的索引 (1)大多数数据库会自动地位主键建立索引,因此额外再定义一个索引就是冗余. 这个额外的索引并无任何好处,它只会成为额外的开销. (2)字符串索引很大,而且也不太可能对它进行全匹配查找. (3)使用组合索引是一个很好的选择,但是大部分