树形数据库设计

树形结构的数据库表Schema设计

程序设计过程中,我们常常用树形结构来表征某些数据的关联关系,如企业上下级部门、栏目结构、商品分类等等,通常而言,这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库,都是以二维表的形式记录存储数据信息,因此是不能直接将Tree存入DBMS,设计合适的Schema及其对应的CRUD算法是实现关系型数据库中存储树形结构的关键。

理想中树形结构应该具备如下特征:数据存储冗余度小、直观性强;检索遍历过程简单高效;节点增删改查CRUD操作高效。无意中在网上搜索到一种很巧妙的设计,原文是英文,看过后感觉有点意思,于是便整理了一下。本文将介绍两种树形结构的Schema设计方案:一种是直观而简单的设计思路,另一种是基于左右值编码的改进方案。

一、基本数据

本文列举了一个食品族谱的例子进行讲解,通过类别、颜色和品种组织食品,树形结构图如下:

二、继承关系驱动的Schema设计

对树形结构最直观的分析莫过于节点之间的继承关系上,通过显示地描述某一节点的父节点,从而能够建立二维的关系表,则这种方案的Tree表结构通常设计为:{Node_id,Parent_id},上述数据可以描述为如下图所示:

这种方案的优点很明显:设计和实现自然而然,非常直观和方便。缺点当然也是非常的突出:由于直接地记录了节点之间的继承关系,因此对Tree的任何CRUD操作都将是低效的,这主要归根于频繁的“递归”操作,递归过程不断地访问数据库,每次数据库IO都会有时间开销。当然,这种方案并非没有用武之地,在Tree规模相对较小的情况下,我们可以借助于缓存机制来做优化,将Tree的信息载入内存进行处理,避免直接对数据库IO操作的性能开销。

三、基于左右值编码的Schema设计

在基于数据库的一般应用中,查询的需求总要大于删除和修改。为了避免对于树形结构查询时的“递归”过程,基于Tree的前序遍历设计一种全新的无递归查询、无限分组的左右值编码方案,来保存该树的数据。

第一次看见这种表结构,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何计算出来的,而且这种表设计似乎并没有保存父子节点的继承关系。但当你用手指指着表中的数字从1数到18,你应该会发现点什么吧。对,你手指移动的顺序就是对这棵树进行前序遍历的顺序,如下图所示。当我们从根节点Food左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后我们回到了根节点Food,并在右边写上了18。

第一次看见这种表结构,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何计算出来的,而且这种表设计似乎并没有保存父子节点的继承关系。但当你用手指指着表中的数字从1数到18,你应该会发现点什么吧。对,你手指移动的顺序就是对这棵树进行前序遍历的顺序,如下图所示。当我们从根节点Food左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后我们回到了根节点Food,并在右边写上了18。

依据此设计,我们可以推断出所有左值大于2,并且右值小于11的节点都是Fruit的后续节点,整棵树的结构通过左值和右值存储了下来。然而,这还不够,我们的目的是能够对树进行CRUD操作,即需要构造出与之配套的相关算法。

四、树形结构CRUD算法

(1)获取某节点的子孙节点

只需要一条SQL语句,即可返回该节点子孙节点的前序遍历列表,以Fruit为例:SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 11 ORDER BY Lft ASC。查询结果如下所示:

那么某个节点到底有多少的子孙节点呢?通过该节点的左、右值我们可以将其子孙节点圈进来,则子孙总数 = (右值 – 左值– 1) / 2,以Fruit为例,其子孙总数为:(11 –2 – 1) / 2 = 4。同时,为了更为直观地展现树形结构,我们需要知道节点在树中所处的层次,通过左、右值的SQL查询即可实现,以Fruit为例:SELECTCOUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=11。为了方便描述,我们可以为Tree建立一个视图,添加一个层次数列,该列数值可以写一个自定义函数来计算,函数定义如下:

[sql] view plaincopy

  1. CREATE FUNCTION dbo.CountLayer
  2. (
  3. @node_id int
  4. )
  5. RETURNS int
  6. AS
  7. begin
  8. declare @result int
  9. set @result = 0
  10. declare @lft int
  11. declare @rgt int
  12. if exists(select Node_id from Tree where Node_id = @node_id)
  13. begin
  14. select @lft = Lft, @rgt = Rgt from Tree where node_id = @node_id
  15. select @result = count(*) from Tree where Lft <= @lft and Rgt >= @rgt
  16. end
  17. return @result
  18. end
  19. GO

基于层次计算函数,我们创建一个视图,添加了新的记录节点层次的数列:

[sql] view plaincopy

  1. CREATE VIEW dbo.TreeView
  2. AS
  3. SELECT Node_id, Name, Lft, Rgt, dbo.CountLayer(Node_id) AS Layer FROM dbo.Tree ORDER BY Lft
  4. GO

创建存储过程,用于计算给定节点的所有子孙节点及相应的层次:

[sql] view plaincopy

  1. CREATE PROCEDURE [dbo].[GetChildrenNodeList]
  2. (
  3. @node_id int
  4. )
  5. AS
  6. declare @lft int
  7. declare @rgt int
  8. if exists(select Node_id from Tree where node_id = @node_id)
  9. begin
  10. select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
  11. select * from TreeView where Lft between @lft and @rgt order by Lft ASC
  12. end
  13. GO

现在,我们使用上面的存储过程来计算节点Fruit所有子孙节点及对应层次,查询结果如下:

从上面的实现中,我们可以看出采用左右值编码的设计方案,在进行树的查询遍历时,只需要进行2次数据库查询,消除了递归,再加上查询条件都是数字的比较,查询的效率是极高的,随着树规模的不断扩大,基于左右值编码的设计方案将比传统的递归方案查询效率提高更多。当然,前面我们只给出了一个简单的获取节点子孙的算法,真正地使用这棵树我们需要实现插入、删除同层平移节点等功能。

(2)获取某节点的族谱路径

假定我们要获得某节点的族谱路径,则根据左、右值分析只需要一条SQL语句即可完成,以Fruit为例:SELECT* FROM Tree WHERE Lft < 2 AND Rgt > 11 ORDER BY Lft ASC ,相对完整的存储过程:

[sql] view plaincopy

  1. CREATE PROCEDURE [dbo].[GetParentNodePath]
  2. (
  3. @node_id int
  4. )
  5. AS
  6. declare @lft int
  7. declare @rgt int
  8. if exists(select Node_id from Tree where Node_id = @node_id)
  9. begin
  10. select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
  11. select * from TreeView where Lft < @lft and Rgt > @rgt order by Lft ASC
  12. end
  13. GO

(3)为某节点添加子孙节点

假定我们要在节点“Red”下添加一个新的子节点“Apple”,该树将变成如下图所示,其中红色节点为新增节点。

仔细观察图中节点左右值变化,相信大家都应该能够推断出如何写SQL脚本了吧。我们可以给出相对完整的插入子节点的存储过程:

[sql] view plaincopy

  1. CREATE PROCEDURE [dbo].[AddSubNode]
  2. (
  3. @node_id int,
  4. @node_name varchar(50)
  5. )
  6. AS
  7. declare @rgt int
  8. if exists(select Node_id from Tree where Node_id = @node_id)
  9. begin
  10. SET XACT_ABORT ON
  11. BEGIN TRANSCTION
  12. select @rgt = Rgt from Tree where Node_id = @node_id
  13. update Tree set Rgt = Rgt + 2 where Rgt >= @rgt
  14. update Tree set Lft = Lft + 2 where Lft >= @rgt
  15. insert into Tree(Name, Lft, Rgt) values(@node_name, @rgt, @rgt + 1)
  16. COMMIT TRANSACTION
  17. SET XACT_ABORT OFF
  18. end
  19. GO

(4)删除某节点

如果我们想要删除某个节点,会同时删除该节点的所有子孙节点,而这些被删除的节点的个数为:(被删除节点的右值 – 被删除节点的左值+ 1) / 2,而剩下的节点左、右值在大于被删除节点左、右值的情况下会进行调整。来看看树会发生什么变化,以Beef为例,删除效果如下图所示。

则我们可以构造出相应的存储过程:

[sql] view plaincopy

  1. CREATE PROCEDURE [dbo].[DelNode]
  2. (
  3. @node_id int
  4. )
  5. AS
  6. declare @lft int
  7. declare @rgt int
  8. if exists(select Node_id from Tree where Node_id = @node_id)
  9. begin
  10. SET XACT_ABORT ON
  11. BEGIN TRANSCTION
  12. select @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_id
  13. delete from Tree where Lft >= @lft and Rgt <= @rgt
  14. update Tree set Lft = Lft – (@rgt - @lft + 1) where Lft > @lft
  15. update Tree set Rgt = Rgt – (@rgt - @lft + 1) where Rgt > @rgt
  16. COMMIT TRANSACTION
  17. SET XACT_ABORT OFF
  18. end
  19. GO

五、总结

我们可以对这种通过左右值编码实现无限分组的树形结构Schema设计方案做一个总结:

(1)优点:在消除了递归操作的前提下实现了无限分组,而且查询条件是基于整形数字的比较,效率很高。

(2)缺点:节点的添加、删除及修改代价较大,将会涉及到表中多方面数据的改动。

当然,本文只给出了几种比较常见的CRUD算法的实现,我们同样可以自己添加诸如同层节点平移、节点下移、节点上移等操作。有兴趣的朋友可以自己动手编码实现一下,这里不在列举了。值得注意的是,实现这些算法可能会比较麻烦,会涉及到很多条update语句的顺序执行,如果顺序调度考虑不周详,出现Bug的话将会对整个树形结构表产生惊人的破坏。因此,在对树形结构进行大规模修改的时候,可以采用临时表做中介,以降低代码的复杂度,同时,强烈推荐在做修改之前对表进行完整备份,以备不时之需。在以查询为主的绝大多数基于数据库的应用系统中,该方案相比传统的由父子继承关系构建的数据库Schema更为适用。

树形数据库设计

时间: 2024-09-29 04:30:13

树形数据库设计的相关文章

YbSoftwareFactory 代码生成插件【十八】:树形结构下的查询排序的数据库设计

树形结构的排序在中国特色下十分普遍也非常重要,例如常说的五大班子,党委>人大>政府>政协>纪委,每个班子下还有部门,岗位,人员,最终排列的顺序通常需要按权力大小.重要性等进行排列,顺序排列不好可是重大的罪过,领导很生气,后果很严重.这种排序方式本质上就是典型的树形结构深度排序,但在数据库中很难直接通过SQL语句简单高效地进行处理,更不用说还要支持不同类型数据库了. 当前解决此类问题,主要有两种方法. 1. 排序码方式 原理:在每个树形节点上均设置一个排序码,排序码通常是一个字符串并

数据库设计 Step by Step (1)——扬帆启航

引言:一直在从事数据库开发和设计工作,也看了一些书籍,算是略有心得.很久之前就想针 对关系数据库设计进行整理.总结,但因为种种原因迟迟没有动手,主要还是惰性使然.今天也算是痛下决心开始这项卓绝又令我兴奋的工作.这将是一个系列的文 章,我将以讲座式的口吻展开讨论(个人偷懒,这里的总结直接拿去公司培训新人用). 系列的第一讲我们先来回答下面几个问题 数据库是大楼的根基 大多数程序员都很急切,在了解基本需求之后希望很快的进入到编码阶段(可能只有产出代码才能反映工作量),对于数据库设计思考得比较少. 这

11 个重要的数据库设计规则

英文原文: 11 Important Database designing rules 简介 在您开始阅读这篇文章之前,我得明确地告诉您,我并不是一个数据库设计领域的大师.以下列出的 11 点是我对自己在平时项目实践和阅读中学习到的经验总结出来的个人见解.我个人认为它们对我的数据库设计提供了很大的帮助.实属一家之言,欢迎拍砖 : ) 我之所以写下这篇这么完整的文章是因为,很多开发者一参与到数据库设计,就会很自然地把 “三范式” 当作银弹一样来使用.他们往往认为遵循这个规范就是数据库设计的唯一标准

11个重要的数据库设计规则

英文原文: 11 Important Database designing rules 简介 在您开始阅读这篇文章之前,我得明确地告诉您,我并不是一个数据库设计领域的大师.以下列出的 11 点是我对自己在平时项目实践和阅读中学习到的经验总结出来的个人见解.我个人认为它们对我的数据库设计提供了很大的帮助.实属一家之言,欢迎拍砖 : ) 我之所以写下这篇这么完整的文章是因为,很多开发者一参与到数据库设计,就会很自然地把 “三范式” 当作银弹一样来使用.他们往往认为遵循这个规范就是数据库设计的唯一标准

数据库设计——11 个重要的数据库设计规则

简介 在您开始阅读这篇文章之前,我得明确地告诉您,我并不是一个数据库设计领域的大师.以下列出的 11 点是我对自己在平时项目实践和阅读中学习到的经验总结出来的个人见解.我个人认为它们对我的数据库设计提供了很大的帮助.实属一家之言,欢迎拍砖 : ) 我之所以写下这篇这么完整的文章是因为,很多开发者一参与到数据库设计,就会很自然地把 “三范式” 当作银弹一样来使用.他们往往认为遵循这个规范就是数据库设计的唯一标准.由于这种心态,他们往往尽管一路碰壁也会坚持把项目做下去. 如果你对 “三范式” 不清楚

Atitit.操作注册表 树形数据库 注册表的历史 java版本类库总结

Atitit.操作注册表 树形数据库 注册表的历史 java版本类库总结 1. 注册表是树形数据库 1 2. 注册表的由来 1 3. Java  操作注册表 2 3.1. 使用Preferences API (限定访问路径了) 2 3.2. 使用JNI 3 3.3. Jregistrykey 推荐 4 3.4. Jregistry 4 4. org.openqa.selenium.os.WindowsUtils 4 4.1. 以及进程管理 4 1. 注册表是树形数据库 树形数据库,但不提供类似S

数据库设计——评论回复功能

1.概述 评论功能已经成为APP和网站开发中的必备功能.本文主要介绍评论功能的数据库设计. 评论功能最主要的是发表评论和回复评论(删除功能在后台).评论功能的拓展功能体现有以下几方面: (1)单篇文章的评论数量和信息展示: (2)从时间维度,按照时间倒叙的方式展示动态的用户评论信息: (3)不同栏目,不同模块,不同时间维度的评论排行展示: (4)精华评论的单独推荐和聚合展示: (5)评论后直接分享到绑定的第三方平台: (6)点赞数.回复数等维度的排行等. 评论的后台管理: (1)删除: (2)推

评论系统数据库设计及实现

评论系统数据库设计及实现 需求分析 一般我们浏览网站的时候经常能看到如下图的这种效果(图片来自CSDN) 这种评论层层嵌套,每个评论下面还挂着若干个对评论的回复. 这种结构类似于树状结构,用户看起来一目了然,也是一种非常主流的评论系统设计. 数据库设计 在以评论为主的树形结构中,数据库的设计非常灵活,可以是单表设计,每个评论都有一个parent_id指向父评论.还可以分开为两个表,评论一张表,对评论的回复是另一张表. 这里我使用的是单表设计. 数据表设计如下.由于我开发的是一个新闻系统,所以我就

Java精品高级课,架构课,java8新特性,P2P金融项目,程序设计,功能设计,数据库设计,第三方支付,web安全,视频教程

36套精品Java架构师,高并发,高性能,高可用,分布式,集群,电商,缓存,性能调优,设计模式,项目实战,P2P金融项目,大型分布式电商实战视频教程 视频课程包含: 高级Java架构师包含:Spring boot.Spring  cloud.Dubbo.Elasticsearch,Redis.ActiveMQ.Nginx.Mycat.Spring.MongoDB.ZeroMQ.Git.Nosql.Jvm.Mecached.Netty.Nio.Mina.java8新特性,P2P金融项目,程序设计,