可持久化专题(一)——浅谈主席树:可持久化线段树

前言

不得不说,可持久化数据结构真是太难了!

由于数据结构这东西真的太玄学了,学这个主席树我真的学了很久。


简介

主席树为什么叫主席树?据说因为它是一个名字缩写为\(HJT\)的神犇发明的,与当时主席的名字缩写一样......

主席树实质上就是一棵可持久化线段树,它的具体实现可以看下面。


让我们从值域线段树开始说起

要学主席树,我们就要先学值域线段树

值域线段树的区间存的并不是节点信息,而是在值在某一范围内的数的个数

如图就是一棵值域线段树,其中1号节点存储的是大于等于1小于等于4的数字个数,2号节点存储的是大于等于1小于等于2的数字个数,3号节点存储的是大于等于3小于等于4的数字个数,4号节点存储的是等于1的数字个数,5号节点存储的是等于2的数字个数,6号节点存储的是等于3的数字个数,7号节点存储的是等于4的数字个数。

值域线段树的查询也挺简单的,若要查询这段区间内的第\(k\)大,只要比较当前元素的左子树大小加1(1是当前元素本身的大小)与询问的\(k\),若大于等于,就访问左子树,否则将\(k\)减去当前元素的左子树大小加1,然后访问右子树。

这和平衡树有什么区别!!!

还有一个问题,就是值域线段树存储的区间范围是固定的,所以如果要查询区间第\(k\)大,我们就不能只用一棵值域线段树。

考虑建\(n\)棵值域线段树,每棵值域线段树存储区间\([1,i]\)的信息,这样一来,要查询\([l,r]\)的第\(k\)大时,只要在查询的过程中,将第\(r\)棵值域线段树的信息减去第\(l-1\)棵值域线段树的信息即可,这利用了前缀和的思想。

或许你会问,这有什么用?建\(n\)棵树,内存那么大,我平衡树第一个不服!

好吧,不服就不服,值域线段树还是有点用的,因为平衡树没法可持久化啊(可持久化\(Treap\)请走开)!


从值域线段树到主席树

知道了值域线段树,我们就可以开始尝试实现主席树了。

来研究一下下面两棵分别存储\([1,3]\)和\([1,4]\)区间信息的值域线段树(圆圈中为以该节点为根的子树大小)。

仔细观察可得,我们每次新加入一个节点,有影响的只有图中\(\color{red}{标红}\)的节点。

再仔细观察一下,这些节点都在一条链上(废话)。

那么,我们就会有一个大胆的想法:可不可以每次只新建一条链而不是一棵树,就像下面这样?

这就是传说中的主席树了。


主席树的具体实现

当然,真正实现主席树时,还是有一些细节要注意的。

这里就不多讲了,直接上代码吧:(洛谷板子题

#include<bits/stdc++.h>
#define max(x,y) ((x)>(y)?(x):(y))
#define min(x,y) ((x)<(y)?(x):(y))
#define LL long long
#define swap(x,y) (x^=y,y^=x,x^=y)
#define tc() (A==B&&(B=(A=ff)+fread(ff,1,100000,stdin),A==B)?EOF:*A++)
#define pc(ch) (pp_<100000?pp[pp_++]=(ch):(fwrite(pp,1,100000,stdout),pp[(pp_=0)++]=(ch)))
#define N 200000
int pp_=0;char ff[100000],*A=ff,*B=ff,pp[100000];
using namespace std;
int n,Q,m,tot=0,rt[N+5],a[N+5],p[N+5];
struct Chairman_Tree
{
    int Son[2],Size;
}node[N<<6];
inline void read(int &x)
{
    x=0;int f=1;char ch;
    while(!isdigit(ch=tc())) f=ch^‘-‘?1:-1;
    while(x=(x<<3)+(x<<1)+ch-‘0‘,isdigit(ch=tc()));
    x*=f;
}
inline void write(int x)
{
    if(x<0) pc(‘-‘),x=-x;
    if(x>9) write(x/10);
    pc(x%10+‘0‘);
}
inline void Build(int &rt,int l,int r)//建出一棵初始时的的树,和传统的线段树几乎一样
{
    rt=++tot;//新建一个节点,动态开点也是主席树中特别重要的
    int mid=l+r>>1;
    if(!(l^r)) return;
    Build(node[rt].Son[0],l,mid),Build(node[rt].Son[1],mid+1,r);//分别建树
}
inline void NewPoint(int &rt,int lst,int l,int r,int val)//新建一个节点(准确来说,应该是新建一条链)
{
    node[rt=++tot]=node[lst],++node[rt].Size;//动态开点,先复制原先的节点,然后将子树大小加1
    int mid=l+r>>1;
    if(!(l^r)) return;
    if(val<=mid) NewPoint(node[rt].Son[0],node[lst].Son[0],l,mid,val);//如果插入的新值比当前元素小(或等于),那么就新建一个左儿子
    else NewPoint(node[rt].Son[1],node[lst].Son[1],mid+1,r,val);//否则,新建一个右儿子
}
inline int Query(int rt1,int rt2,int l,int r,int k)//区间查询,相当于同时在两棵值域线段树上询问
{
    int mid=l+r>>1;
    if(!(l^r)) return l;//如果l与r相等,就返回l
    if(node[node[rt2].Son[0]].Size-node[node[rt1].Son[0]].Size>=k) return Query(node[rt1].Son[0],node[rt2].Son[0],l,mid,k);//如果当前左子树大小加1大于等于询问的k,那么访问左子树
    else return Query(node[rt1].Son[1],node[rt2].Son[1],mid+1,r,k-node[node[rt2].Son[0]].Size+node[node[rt1].Son[0]].Size);//否则,将k减去当前左子树大小加1
}
inline int num(int x)//求出一个数离散化后的值,一个二分的过程
{
    int l=1,r=m;
    while(l<=r)
    {
        int mid=l+r>>1;
        if(p[mid]==x) return mid;
        else if(p[mid]>x) r=mid-1;
        else l=mid+1;
    }
}
int main()
{
    register int i;
    for(read(n),read(Q),i=1;i<=n;++i) read(a[i]),p[i]=a[i];
    for(sort(p+1,p+n+1),Build(rt[0],i=1,m=unique(p+1,p+n+1)-p-1);i<=n;++i) NewPoint(rt[i],rt[i-1],1,m,num(a[i]));//将元素离散化,新建一棵树以及n条链,注意存储每条链的根节点的编号
    for(i=1;i<=Q;++i)//询问
    {
        int x,y,k;
        read(x),read(y),read(k),write(p[Query(rt[x-1],rt[y],1,m,k)]),pc(‘\n‘);//利用前缀和思想
    }
    return fwrite(pp,1,pp_,stdout),0;
}

原文地址:https://www.cnblogs.com/chenxiaoran666/p/ChairmanTree.html

时间: 2024-08-28 06:23:54

可持久化专题(一)——浅谈主席树:可持久化线段树的相关文章

HDU - 6704 K-th occurrence (后缀数组+主席树/后缀自动机+线段树合并+倍增)

题意:给你一个长度为n的字符串和m组询问,每组询问给出l,r,k,求s[l,r]的第k次出现的左端点. 解法一: 求出后缀数组,按照排名建主席树,对于每组询问二分或倍增找出主席树上所对应的的左右端点,求第k大的下标即可. 1 #include<bits/stdc++.h> 2 using namespace std; 3 typedef long long ll; 4 const int N=1e5+10,mod=998244353; 5 char buf[N]; 6 int s[N],sa[

[bzoj3932][CQOI2015]任务查询系统-题解[主席树][权值线段树]

Description 最近实验室正在为其管理的超级计算机编制一套任务管理系统,而你被安排完成其中的查询部分.超级计算机中的 任务用三元组(Si,Ei,Pi)描述,(Si,Ei,Pi)表示任务从第Si秒开始,在第Ei秒后结束(第Si秒和Ei秒任务也在运行 ),其优先级为Pi.同一时间可能有多个任务同时执行,它们的优先级可能相同,也可能不同.调度系统会经常向 查询系统询问,第Xi秒正在运行的任务中,优先级最小的Ki个任务(即将任务按照优先级从小到大排序后取前Ki个 )的优先级之和是多少.特别的,如

【BZOJ】1146: [CTSC2008]网络管理Network(树链剖分+线段树套平衡树+二分 / dfs序+树状数组+主席树)

第一种做法(时间太感人): 这题我真的逗了,调了一下午,疯狂造数据,始终找不到错. 后来发现自己sb了,更新那里没有打id,直接套上u了.我.... 调了一下午啊!一下午的时光啊!本来说好中午A掉去学习第二种做法,噗 好吧,现在第一种做法是hld+seg+bst+二分,常数巨大,log^4级别,目前只会这种. 树剖后仍然用线段树维护dfs序区间,然后在每个区间建一颗平衡树,我用treap,(这题找最大啊,,,囧,并且要注意,这里的rank是比他大的数量,so,我们在二分时判断要判断一个范围,即要

主席树——多棵线段树的集合

主席树: (不要管名字) 我们有的时候,会遇到很多种情况,对于每一种情况,都需要通过线段树的操作实现. 碰巧的是,相邻两种情况下的线段树的差异不大.(总体的差异次数是O(N)级别的,均摊就是O(常数)的了) 显然的是,我们不能对于每种情况都建造一棵线段树.n^n 空间直接MLE无疑. 救命稻草是:发现相邻两种情况下的线段树的差异不大. 所以,我们是否可以让不同的线段树共用同一个节点呢?!?!? 这就是主席树的本质.也是精妙之处所在. 代码实现不是很麻烦. 我一般用传返回值形式,每次返回一个节点编

Aizu 2450 Do use segment tree 树链剖分+线段树

Do use segment tree Time Limit: 1 Sec Memory Limit: 256 MB 题目连接 http://www.bnuoj.com/v3/problem_show.php?pid=39566 Description Given a tree with n (1 ≤ n ≤ 200,000) nodes and a list of q (1 ≤ q ≤ 100,000) queries, process the queries in order and out

Hdu 3966 Aragorn&#39;s Story (树链剖分 + 线段树区间更新)

题目链接: Hdu 3966 Aragorn's Story 题目描述: 给出一个树,每个节点都有一个权值,有三种操作: 1:( I, i, j, x ) 从i到j的路径上经过的节点全部都加上x: 2:( D, i, j, x ) 从i到j的路径上经过的节点全部都减去x: 3:(Q, x) 查询节点x的权值为多少? 解题思路: 可以用树链剖分对节点进行hash,然后用线段树维护(修改,查询),数据范围比较大,要对线段树进行区间更新 1 #include <cstdio> 2 #include

hdu 1166 树状数组 线段树

敌兵布阵 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 51177    Accepted Submission(s): 21427 Problem Description C国的死对头A国这段时间正在进行军事演习,所以C国间谍头子Derek和他手下Tidy又开始忙乎了.A国在海岸线沿直线布置了N个工兵营地,Derek和Tidy的任务

【bzoj3589】动态树 树链剖分+线段树

题目描述 别忘了这是一棵动态树, 每时每刻都是动态的. 小明要求你在这棵树上维护两种事件 事件0:这棵树长出了一些果子, 即某个子树中的每个节点都会长出K个果子. 事件1:小明希望你求出几条树枝上的果子数. 一条树枝其实就是一个从某个节点到根的路径的一段. 每次小明会选定一些树枝, 让你求出在这些树枝上的节点的果子数的和. 注意, 树枝之间可能会重合, 这时重合的部分的节点的果子只要算一次. 输入 第一行一个整数n(1<=n<=200,000), 即节点数. 接下来n-1行, 每行两个数字u,

BZOJ2243 (树链剖分+线段树)

Problem 染色(BZOJ2243) 题目大意 给定一颗树,每个节点上有一种颜色. 要求支持两种操作: 操作1:将a->b上所有点染成一种颜色. 操作2:询问a->b上的颜色段数量. 解题分析 树链剖分+线段树. 开一个记录类型,记录某一段区间的信息.l 表示区间最左侧的颜色 , r 表示区间最右侧的颜色 , sum 表示区间中颜色段数量. 合并时判断一下左区间的右端点和有区间的左端点的颜色是否一样. 树上合并时需要用两个变量ans1,ans2来存储.ans1表示x往上走时形成的链的信息,