一、什么是范式
1.1、范式:Normal Format,是离散数学的知识,是为了解决数据的存储与优化而提出来的。要求存储数据后,凡是能够通过关系寻找出来的数据,坚决不再重复存储,终极目标是为了减少数据的冗余。
1.2、范式是一种分层的规范,分为6层,每一层都比上一层更加严格,若要满足下一层范式,前提是满足上一层范式。6层范式:1NF,2NF...6NF;1NF是最底层,要求最低,6NF最高层,要求最严格。
1.3、mysql属于关系型数据库,有空间浪费,表设计时也要致力于节省存储空间。这与范式要解决的问题不谋而合,所以在设计mysql数据库时,会利用范式来指导设计。但是数据库不单是要解决空间问题,还要保证效率问题,范式只为解决空间问题,所以数据库的设计不可能完全按照范式的要求做。一般情况下,满足前三种范式就可以了。
1.4、范式在数据库的设计中是有指导意义,但不是强制规范。
二、第一范式
1NF:第一范式。在数据表存储数据的时候,如果表中设计的字段存储的数据,在取出来使用之前还需要额外的处理(拆分),那么表的设计不满足第一范式。第一范式要求字段的数据具有原子性,不可再分。看下面的例子:
上表设计在某种情况下不存在问题。但是如果需求是将讲课时间查出来后,分别显示开课时间和结课时间,即将字段"讲课时间"的数据拆分使用,这就违背了数据的原子性,不符合第一范式。解决方案就是将字段"讲课时间"拆成"开课时间"和"结课时间"两个字段。需要注意的是,如果需求只是显示讲课时间,不拆开数据,上表就不存在问题。所以,表设计是否满足范式也是看需求的。
三、第二范式
2NF:第二范式,前提是满足第一范式。在数据表设计的过程中,如果有复合主键,且表中有字段并不是由整个主键来确定,而是依赖主键中的某个字段(主键的部分);存在字段依赖主键的的部分的问题,称之为【部分依赖】。第二范式要求不能出现部分依赖。
举例: 下表使用复合主键:讲师+班级,字段"性别"依赖讲师,而与班级无关,这就是部分依赖。
解决方案:使用逻辑主键
四、第三范式
3NF:第三范式,前提是先满足第二范式。理论上讲,一张表中所有的字段都应该直接依赖主键(逻辑主键,代表的是业务主键), 如果表设计中存在一个字段,并不直接依赖主键,而是通过某个非主键字段依赖,最终实现依赖主键,把这种不是直接依赖主键而是依赖非主键字段的依赖关系称之为【传递依赖】。第三范式就是要解决传递依赖的问题。第三范式要求所有字段都依赖主属性。
五、逆规范化
上面的例子中,我们可以通过讲师ID查询讲师表获取讲师信息,但是这需要查询两张表(关联查询),比查询一张表效率要低。如果表记录非常多,为了效率,我们可能会讲师相关的常用信息也添加到开课表,多数情况下我们就查询开课表这一张表就可以满足需求,这样效率高。
逆规范化会导致数据冗余,所以我们要从数据冗余和查询效率两方面综合考虑。
原文地址:https://www.cnblogs.com/xy-ouyang/p/10531858.html