前言
树链剖分,我觉得最精妙的地方就在于它是通过$dfs$序将树形结构转为线性结构便于处理,进而可以用数据结构(线段树、树状数组等)去进行修改和查询。
将复杂的结构转化为相对我们熟悉简单的结构,这个思想对很多问题是通吃的,不仅仅在树形问题,算法中,在其他领域中也常常会用到这种思想
我们先来回顾两个问题:
1.将树从$x$到$y$结点最短路径上所有节点的值都加上z
我们很容易想到,树上差分可以以 $O(n+m)$的优秀复杂度解决这个问题
2.求树从$x$到$y$结点最短路径上所有节点的值之和
$lca$大水题,我们又很容易地想到, $dfs$ $O(n)$预处理每个节点的$dis$(即到根节点的最短路径长度)
然后对于每个询问,求出$x,y$两点的$lca$,利用$lca$的性质$dis(x,y)=dis(x)+dis(y)-2*dis(lca)$求出结果,时间复杂度 $O(mlogn+n)$
现在来思考一个$bug$:
如果刚才的两个问题结合起来,成为一道题的两种操作呢?
刚才的方法显然就不够优秀了(每次询问之前要跑$dfs$更新 $dis$ )
理解
树剖是通过轻重边剖分将树分割成多条链,然后利用数据结构来维护这些链(本质上是一种优化暴力)
给定一棵有根树,对于每个非叶结点$u$,设$u$的子树中结点数最多的子树的树根为$v$,则标记$(u,v)$为重边,从$u$出发往下的其他边均为轻边
如图所示(结点中的数字代表结点的$size$值,即以该结点为根的子树的结点数)
根据上面的定义,只需一次$DFS$就能把一棵有根树分解成若干重路径(重边组成的路径)和若干轻边。
有些资料也把重路径称为树链,因此轻重路径剖分也称树链剖分。 (下面的定理结论可不看)
路径剖分中最重要的定理如下:若$v$是$u$的子结点,$(u,v)$是轻边,则$size(v)<size(u)/2$,其中$size(u)$表示以$u$为根的子树中的结点总数(可以自己推导下)
由此可以得到如下的重要结论:对于任意非根结点$u$,在$u$到根的路径上,轻边和重路径的条数均不超过$log_{2}n$,因为每碰到一条轻边,$size$值就会减半。(对于概念,我还是觉得刘汝佳讲的最准确和便于理解)
因此重链剖分可以将树上的任意一条路径划分成不超过$O(logn)$条连续的链,每条链上的点深度互不相同(即是自底向上的一条链,链上所有点的 $LCA$ 为链的一个端点)。
重链剖分还能保证划分出的每条链上的节点 $DFS$ 序连续,因此可以方便地用一些维护序列的数据结构(如线段树)来维护树上路径的信息,如:
1.修改 树上两点之间的路径上 所有点的值
2.查询 树上两点之间的路径上 节点权值的 和/极值/其它(在序列上可以用数据结构维护,便于合并的信息)
除了配合数据结构来维护树上路径信息,树剖还可以用来$O(logn)$ (且常数较小)地求 $LCA$。
在某些题目中,还可以利用其性质来灵活地运用树剖
实现
首先第一遍$dfs$,对于每个节点,我们主要是求出它所在子树的大小并标记重儿子
void dfs1(int u, int fa){ size[u] = 1; //这个点本身size=1 for(int i = head[u]; i; i = e[i].next){ int v = e[i].to; if(v==fa) continue; dep[v] = dep[u] + 1, f[v] = u; dfs1(v, u), size[u] += size[v]; //子节点的size已被处理,用它来更新父节点的size if(size[v]>size[son[u]]) son[u] = v; //选取size最大的作为重儿子 } }
第二遍 dfs,然后连接重链,同时标记每一个节点的 dfs序,并且为了用数据结构来维护重链,我们在 dfs时保证一条重链上各个节点 dfs序连续
原文地址:https://www.cnblogs.com/wizarderror/p/12192803.html