关系数据库的范式和反范式设计

关于范式 Normal Form

范式是关系数据库理论的基础,也是我们在设计数据库结构过程中所要遵循的规则和指导方法。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式,才能设计出高效率、优雅的数据库,否则可能会设计出错误的数据库。

目前关系数据库有六种范式:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,还又称完美范式)。满足最低要求的叫第一范式,简称1NF。在第一范式基础上进一步满足一些要求的为第二范

式,简称2NF。其余依此类推。各种范式呈递次规范,越高的范式数据库冗余越小。通常所用到的只是前三个范式,即:第一范式(1NF),第二范式(2NF),第三范式(3NF)。

  • 第一范式(1NF):强调的是列的原子性,即列不能够再分成其他几列。简而言之,第一范式就是无重复的列。
  • 第二范式(2NF):首先要满足它是1NF,另外还需要包含两部分内容:一是表必须有一个主键;二是没有包含在主键中的列必须完全依赖于主键,而不能只依赖于主键的一部分。

要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性

  • 第三范式(3NF):在1NF基础上,任何非主属性不依赖于其它非主属性[在2NF基础上消除传递依赖]。第三范式(3NF)是第二范式(2NF)的一个子集,即满足第三范式(3NF)必须满足第二范式(2NF)。

简而言之,第三范式(3NF)要求一个关系中不包含已在其它关系已包含的非主关键字信息。例如,存在一个部门信息表,其中每个部门有部门编号(dept_id)、部门名称、部门简介等信息。那么在员工信息表中列出部门编号后就不能再将部门名称、部门简介等与部门有关的信息再加入员工信息表中。如果不存在部门信息表,则根据第三范式(3NF)也应该构建它,否则就会有大量的数据冗余。简而言之,第三范式就是属性不依赖于其它非主属性,也就是在满足2NF的基础上,任何非主属性不得传递依赖于主属性。

关于范式的讨论

第二范式和第三范式如何区别?

第二范式:非主键列是否依赖主键(包括一列通过某一列间接依赖主键),要是有依赖关系的就是第二范式;

第三范式:非主键列是否是直接依赖主键,不能是那种通过传递关系的依赖的。要是符合这种就是第三范式;

使用范式有哪些优点和缺点? 

范式可以避免数据冗余,减少数据库的空间,减轻维护数据完整性的麻烦。

范式再给我们带来的上面的好处时,同时也伴随着一些不好的地方:按照范式的规范设计出来的表,等级越高的范式设计出来的表越多

如第一范式可能设计出来的表可能只有一张表而已,再按照第二范式去设计这张表时就可能出来两张或更多张表,如果再按第三范式或更高的范式去设计这张表会出现更多比第二范式多的表。

表的数量越多,当我们去查询一些数据,必然要去多表中去查询数据,这样查询的时间要比在一张表中查询中所用的时间要高很多。也就是说我们所用的范式越高,对数据操作的性能越低。

所以我们在利用范式设计表的时候,要根据具体的需求再去权衡是否使用更高范式去设计表。在一般的项目中,我们用的最多也就是第三范式,第三范式也就可以满足我们的项目需求,性能好而且方便管理数据;

当我们的业务所涉及的表非常多,经常会有多表发生关系,并且我们对表的操作要时间上要尽量的快,这时可以考虑我们使用“反范式”。

关于反范式

不满足范式的模型,就是反范式模型。

反范式跟范式所要求的正好相反,在反范式的设计模式,我们可以允许适当的数据的冗余,用这个冗余去取操作数据时间的缩短。本质上就是用空间来换取时间,把数据冗余在多个表中,当查询时可以减少或者是避免表之间的关联;

RDBMS模型设计过程中,常常使用范式约束我们的模型,但在NOSQL模型中则大量采用反范式。

范式和反范式的对比

范式化模型 数据没有冗余,更新容易
当表的数量比较多,

查询设计需要很多关联模型(join)时,会导致查询性能低下

反范式化模型
数据冗余将带来很好的读取性能

(因为不需要join很多表,而且通常反范式模型很少做更新操作)


需要维护冗余数据,从目前NoSQL的发展可以看到,

对磁盘空间的消耗是可以接受的

参考: 百度百科·数据库范式

关系数据库的范式和反范式

数据模型的范式化和反范式化

时间: 2024-09-29 23:48:01

关系数据库的范式和反范式设计的相关文章

关系数据库涉及中的范式与反范式

数据中设计中的范式与反范式 解释一下关系数据库的第一第二第三范式?

MySQL中数据中设计中的范式与反范式

设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小.但是有些时候一昧的追求范式减少冗余,反而会降低数据读写的效率,这个时候就要反范式,利用空间来换时间. 目前关系数据库有六种范式:第一范式(1NF).第二范式(2NF).第三范式(3NF).巴斯-科德范式(BCNF).第四范式(4NF)和第五范式(5NF,又称完美范式).满足最低要求的范式是第一范式(1NF).在第一范式的基础上进一步满足更多规范要求的称

数据库三大范式和反范式 · oldmee

后一个范式都是在满足前一个范式的基础上建立的. 1NF 无重复的列.表中的每一列都是不可分割的基本数据项.不满足1NF的数据库不是关系数据库.如联系人表(姓名,电话),一个联系人有家庭电话和公司电话,则不符合1NF,应拆分为(姓名,家庭电话,公司电话). 2NF 属性完全依赖于主键.不能存在仅依赖于关键一部分的属性.如选课关系(学号,课程名称,成绩,学分),组合关键字(学号,课程名称)作为主键.其不满足2NF,因为存在决定关系:课程名称->学分,即存在组合主键中的部分字段决定非主属性的情况.会导

范式和反范式的优缺点

在设计数据库时,有范式和反范式的讲究,下面总结一下. 范式的优点: 1)范式化的数据库更新起来更加快: 2)范式化之后,只有很少的重复数据,只需要修改更少的数据: 3)范式化的表更小,可以在内存中执行: 4)很少的冗余数据,在查询的时候需要更少的distinct或者group by语句. 范式的缺点: 5)范式化的表,在查询的时候经常需要很多的关联,因为单独一个表内不存在冗余和重复数据.这导致,稍微复杂一些的查询语句在查询范式的schema上都可能需要较多次的关联.这会增加让查询的代价,也可能使

MySQL中范式与反范式的优缺点

范式化的优点: 范式化更新操作通常比反范式化要快. 当数据较好的范式化时,就只有很少或者没有重复数据,所以,只需要修改更少的数据. 范式化的表通常更小,可以更好地放在内存里,所以执行操作会更快. 很少有多余的数据意味着检索列表数据更少需要distinct或者group by 语句. 范式化的缺点: 范式化设计schema通常需要关联.稍微复杂一些的查询语句在符合范式的schema上都可能需要至少一次关联,也许更多.这样做代价昂贵,也可能使一些索引策略无效.比如,范式化可能将列放在不同的表中,而这

2.2 范式和反范式

2.2.1 第一范式 原子性:要求属性具有原子性,不可再分解. 如学生(学号,姓名,性别,出生年月日),如果认为最后一列还可以再分成(出生年,出生月,出生日),它就不是一范式了,否则就是. 2.2.2 第二范式 惟一性:要求记录有惟一标识,即实体的惟一性,即不存在部分依赖 表:学号.课程号.姓名.学分; 这个表明显说明了两个事务:学生信息, 课程信息.由于非主键字段必须依赖主键,这里学分依赖课程号,姓名依赖与学号,所以不符合二范式. 可能会存在问题: 数据冗余:,每条记录都含有相同信息: 删除异

范式设计和反范式设计

三大范式 第一范式:无重复的列 第二范式:属性完全依赖于主键 第三范式:属性不能传递依赖其他非主属性 范式的作用是避免数据冗余(数据重复). 范式的问题: 按照范式设计出来的表在数据冗余的问题虽然得到解决,但是会生成许多表,导致了表数量的复杂性,其二,查询数据的时候,多表查询的时间远远高于单表查询的时间. 反范式 范式的目的是减小数据冗余,而反范式指的是在一定程度上允许数据冗余,目的是加快数据操作. 对比 范式与反范式是一场时间和空间的较量,满足范式节省空间,满足反范式加快操作速度. 在满足范式

数据库范式?编辑 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

数据库范式 设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小. 目前关系数据库有六种范式:第一范式(1NF).第二范式(2NF).第三范式(3NF).巴斯-科德范式(BCNF).第四范式(4NF)和第五范式(5NF,还又称完美范式). 第一范式(1NF) 所谓第一范式(1NF)是指在关系模型中,对域添加的一个规范要求,所有的域都应该是原子性的,即数据库表的每一列都是不可分割的原子数据项,而不能是集合,

数据库范式设计 和 反范式化设计

三大范式设计 一 数据库表中的所有字段都只具有单一属性 单一属性的列是由基本数据类型所构成的 设计出来的表都是简单的二维表 二 要求表中只具有一个业务主键,也就是说符合第二范式的表不能存在非主键列只对部分主键的依赖关系 三 每一个非主属性既不部分依赖于也不传递依赖于业务主键,也就是在第二范式基础上相处于非主键对主键的传递依赖 优点 可以尽量减少数据冗余 范式化的更新操作比反范式化更快 范式化的表通常比反范式的小 缺点 对于查询需要对多个表进行关联 更难进行索引优化 反范式化设计 反范式化是为了性