SQL反模式学习笔记11 限定列的有效值

2014-10-14 08:46:07

目标：限定列的有效值，将一列的有效字段值约束在一个固定的集合中。类似于数据字典。

反模式：在列定义上指定可选值

1、对某一列定义一个检查约束项，这个约束不允许往列中插入或者更新任何会导致约束失败的值：

　　 create table Bugs(status varchar(20) check(status in(‘new‘,‘in progress‘,‘fixed‘)))。

2、使用域或者用户自定义类型（UDT）等方法。

　 3、使用触发器：编写一个触发器，当修改指定列的内容时触发，将被修改的值和允许输入的值进行匹配，

如果不符合则产生一个错误中断操作。

　　缺点：

　　1、无法查询出所有的约束值来供上层应用程序使用。

不能用select distinct status from Bugs，因为可能有的status目前还没有存储。

　　　　维护不好的话，还有可能造成列表和数据库存储的值，不一致。

　　2、增加新的约束值，需要修改数据库定义或者触发器。

　　3、废弃或修改某个值，可能要修改大量的数据，风险很大也不合理。

　　4、可移植性差，check约束、域，或者UDT在各种数据库中的支持形式并不统一。

如何识别反模式：当出现以下情况时，可能是反模式

　　1、我们不得不将数据库下线，才能在程序中加入一个新的选项。

　　2、这个Status列可以填入这些候选值中的一个。我们不应该改变这个后选值列表。

　　3、程序代码中关于业务规则的选项列表和数据库中的值又不同步了。

合理使用反模式：

　　1、在后选值几乎不变化的时候可以使用。

　　2、存储没有业务逻辑且不需要改变的候选值时非常方便。

比如存储一对二选一切相互对立的值：Left/Right、On/Off等。

　　3、Check约束可以再更多的场景下使用，比如用来检测一个时间区间中start永远小于end。

解决方案：创建一张检查表（类似于字典表），每一行包含一个允许在列中出现的候选值，然后在目标表中定义一个外键约束。

个人经验：在系统中创建一个数据字典表，管理所有可变的候选集合。

结论：在验证固定集合的候选值时使用元数据；

在验证可变集合的候选值时使用数据。

时间： 2024-12-18 15:25:42

SQL反模式学习笔记11 限定列的有效值的相关文章

SQL反模式学习笔记8 多列属性

2014-10-13 10:32:12 目标:存储多值属性反模式:创建多个列.比如一个人具有多个电话号码.座机号码.手机号码等. 1.查询:多个列的话,查询时可能不得不用IN,或者多个OR: 2.添加.删除时确保唯一性.判断是否有值:这些都很麻烦: 3.字段的列数无法确定具体数量. 如何识别反模式:当出现以下情况时,可能是反模式 1.应该支持的动态列的数量是多少? 2.如何才能在SQL查询中同时查询多列? 合理使用反模式: 在默写情况下,一个属性可能有固定数量的候选值,并且他们的存储位置和顺序

SQL反模式学习笔记15 分组

2014-10-14 15:49:19 目标:查询得到每组的max(或者min等其他聚合函数)值,并且得到这个行的其他字段反模式:引用非分组列单值规则:跟在Select之后的选择列表中的每一列,对于每个分组来说都必须返回且仅返回一直值. select ProductId,Max(DateReported) as Latest from Bugs as b Join BugProducts as bp on b.BugId = bp.BugId Group by ProductId; 在G

SQL反模式学习笔记6 支持可变属性【实体-属性-值】

2014-10-11 17:21:31 目标:支持可变属性反模式:使用泛型属性表.这种设计成为实体-属性-值(EAV),也可叫做开放架构.名-值对. 优点:通过增加一张额外的表,可以有以下好处 (1)表中的列很少: (2)新增属性时,不需要新增列.不会影响现有表的结构: (3)存储的字段内容不会为空值. 缺点:(1)查询语句变得更加复杂: (2)使用EAV设计后,需要放弃传统的数据库设计所带来的方便之处,比如:无法保障数据完整性: (3)无法使用SQL的数据类型,比如对日期.金钱等格式内容都只

SQL反模式学习笔记16 使用随机数排序

2014-10-15 10:06:48 目标:随机排序,使用高效的SQL语句查询获取随机数据样本. 反模式:使用RAND()随机函数 SELECT * FROM Employees AS e ORDER BY RAND() Limit 1 缺点:无法利用索引,每次选择的时候都不同且不可预测.进行全表遍历,性能极差. 如何识别反模式:当出现以下情况时,可能是反模式 1.在SQL中,返回一个随机行速度非常慢: 2.要获取所有的记录然后随机一个.要如何增加程序可使用的内存大小? 3.有些列出现的频率比

SQL反模式学习笔记13 使用索引

2014-10-14 10:29:53 目标:优化性能改善性能最好的技术就是在数据库中合理地使用索引. 索引也是数据结构,它能使数据库将指定列中的某个值快速定位在相应的行. 反模式:无规划的使用索引 1.不使用索引或索引不足 2.使用了太多的索引或一些无效的索引 (1)大多数数据库会自动地位主键建立索引,因此额外再定义一个索引就是冗余. 这个额外的索引并无任何好处,它只会成为额外的开销. (2)字符串索引很大,而且也不太可能对它进行全匹配查找. (3)使用组合索引是一个很好的选择,但是大部分

SQL反模式学习笔记22 伪键洁癖，整理数据

2014-10-17 16:31:50 目标:整理数据,使不连续的主键Id数据记录变的连续. 反模式:填充断档的数据空缺. 1.不按照顺序分配编号在插入新行时,通过遍历表,找到的第一个未分配的主键编号分配给新行,来代替原来自动分配的伪主键机制. 使用Select Max(Id) + 1 这种查询语句,会出现并发访问的问题. 2.为现有数据行重新编号:通常做法是找到主键最大的行,然后用最小的未被使用的值来更新它. 缺点:(1)SQL语句比较麻烦: (2)必须同时更新所有引用了你重新分配了主键

SQL反模式学习笔记17 全文搜索

2014-10-16 09:56:37 目标:全文搜索使用SQL搜索关键字,同时保证快速和精确,依旧是相当地困难. SQL的一个基本原来(以及SQL所继承的关系原理)就是一列中的单个数据是原子性的. 反模式:模式匹配使用Like 或者正则表达式. 缺点:(1)无法使用索引,进行全表遍历,非常耗时,性能极低. (2)有时候会返回医疗之外的结果.select * from bugs where description like '%one%', 返回结果可能是money.prone.lonely

SQL反模式学习笔记9 元数据分裂

2014-10-13 15:04:34 目标:支持可扩展性.优化数据库的结构来提升查询的性能以及支持表的平滑扩展. 反模式:克隆表与克隆列 1.将一张很长的表拆分成多张较小的表,使用表中某一个特定的数据字段来给这些拆分出来的表命名. 2.将一个列拆分成多个之列,使用别的列中的不同值给拆分出来的列命名. 为了达到减少每张表记录数的目的,你不得不创建一些有很多列的表,或者创建很多很多表.但是在2个方案中, 你会发现随着数据量的增长,会有越来越多的表或者列. 缺点:(1)不断产生新的表.要将数据拆分到

SQL反模式学习笔记2 乱穿马路

2014-10-10 14:12:02 程序员通常使用逗号分隔的列表来避免在多对多的关系中创建交叉表, 将这种设计方式定义为一种反模式,称为“乱穿马路”. 目标: 存储多属性值,即多对一反模式:将多个值以格式化的逗号分隔存储在一个字段中比如:ProductAccount表(Contacts表),产品与账号信息表,一个产品有有多个联系人账号信息. 1.查询:查询指定账号的产品.不能使用SQL语法中的等号操作符,只能使用like 或者正则表达式,索引将不可用,查询效率降低.