BZOJ 3998 后缀数组

思路:

第一问

建出来后缀数组以后  前缀和一发n-sa[i]-ht[i]+1  二分

第二问

二分判断是带重复的第几

怎么判断呢   找到它  往后扫ht递减sum+=它   跟K判判

注意等于 加一 之类的各种坑爹细节

要死..

//By SiriusRen
#include <bits/stdc++.h>
using namespace std;
const int N=1000050;
int n,cntA[N],cntB[N],A[N],B[N],rk[N],sa[N],tsa[N],ht[N],T,K;
long long sum[N],sum1[N];
char s[N];
void SA(){
    for(int i=1;i<=n;i++)cntA[s[i]]++;
    for(int i=1;i<=256;i++)cntA[i]+=cntA[i-1];
    for(int i=n;i;i--)sa[cntA[s[i]]--]=i;
    rk[sa[1]]=1;
    for(int i=2;i<=n;i++)rk[sa[i]]=rk[sa[i-1]]+(s[sa[i]]!=s[sa[i-1]]);
    for(int l=1;rk[sa[n]]<n;l<<=1){
        memset(cntA,0,sizeof(cntA));
        memset(cntB,0,sizeof(cntB));
        for(int i=1;i<=n;i++)cntA[A[i]=rk[i]]++,cntB[B[i]=(i+l<=n?rk[i+l]:0)]++;
        for(int i=1;i<=n;i++)cntA[i]+=cntA[i-1],cntB[i]+=cntB[i-1];
        for(int i=n;i;i--)tsa[cntB[B[i]]--]=i;
        for(int i=n;i;i--)sa[cntA[A[tsa[i]]]--]=tsa[i];
        rk[sa[1]]=1;
        for(int i=2;i<=n;i++)rk[sa[i]]=rk[sa[i-1]]+(A[sa[i]]!=A[sa[i-1]]||B[sa[i]]!=B[sa[i-1]]);
    }
    for(int i=1,j=0;i<=n;i++){
        j=j?j-1:0;
        while(s[i+j]==s[sa[rk[i]-1]+j])j++;
        ht[rk[i]]=j;
    }
}
void print(int l,int r){for(int i=l;i<=r;i++)putchar(s[i]);}
bool check(int p){
    int tempans=1,l=1,r=n;
    while(l<=r){
        int mid=(l+r)>>1;
        if(sum[mid]>=p)r=mid-1;
        else tempans=mid+1,l=mid+1;
    }
    int hi=p-sum[tempans-1]+ht[tempans],tot=hi+sum1[tempans-1];
    if(tot>=K)return 1;
    for(int i=tempans+1;i<=n;i++){
        hi=min(hi,ht[i]);
        if(!hi)break;
        tot+=hi;
        if(tot>=K)return 1;
    }return 0;
}
void solve(){
    for(int i=1,t;i<=n;i++,K-=t){
        t=n-sa[i]-ht[i]+1;
        if(K<=t){print(sa[i],sa[i]+K-1+ht[i]);return;}
    }puts("-1");
}
signed main(){
    scanf("%s%d%d",s+1,&T,&K),n=strlen(s+1),SA();
    if(!T)solve();
    else{
        for(int i=1;i<=n;i++)sum[i]=sum[i-1]+n-ht[i]-sa[i]+1,sum1[i]=sum1[i-1]+n-sa[i]+1;
        if(sum1[n]<K){puts("-1");return 0;}
        int l=1,r=K+1,ans;
        while(l<=r){
            int mid=(l+r)>>1;
            if(check(mid))ans=mid,r=mid-1;
            else l=mid+1;
        }K=ans;solve();
    }
}
时间: 2024-11-18 19:08:52

BZOJ 3998 后缀数组的相关文章

bzoj 3172 后缀数组|AC自动机

后缀数组或者AC自动机都可以,模板题. /************************************************************** Problem: 3172 User: BLADEVIL Language: C++ Result: Accepted Time:424 ms Memory:34260 kb ****************************************************************/ //By BLADEVI

BZOJ 3172:后缀数组

题意:给N个单词组成的文章,输出每一个单词出现的次数 思路:连接后求sa,对每一个单词求lcp>=len[i]的最大范围 加了二分也没有快多少.. #include"cstdio" #include"queue" #include"cmath" #include"stack" #include"iostream" #include"algorithm" #include"

bzoj 4119 后缀数组 + 并查集

并查集合并的时候更新信息.注意a[ i ] 有负的. #include<cstdio> #include<algorithm> #include<cmath> #include<cstring> #include<vector> #define LL long long #define LD long double #define ull unsigned long long #define fi first #define se second

【BZOJ4566】找相同字符(后缀数组)

[BZOJ4566]找相同字符(后缀数组) 题面 BZOJ 题解 后缀数组的做法,应该不是很难想 首先看到两个不同的串,当然是接在一起求\(SA,height\) 那么,考虑一下暴力 在两个串各枚举一个后缀,他们的\(lcp\)就是对答案产生的贡献 现在优化一下,按照\(SA\)的顺序枚举来处理\(lcp\) 利用一个单调栈维护一下,每次记录一下前面有多少个的贡献和当前答案一样就好啦 只是有点难写... #include<iostream> #include<cstdio> #in

bzoj 3998: [TJOI2015]弦论(后缀自动机)

题目链接:bzoj 3998: [TJOI2015]弦论 题意: 对于一个给定长度为N的字符串,求它的第K小子串是什么. 题解: 后缀自动机O(n)*26解决. 对于op=0,num[i]=1,对于op=1,num[i]=cnt[i]. 因为cnt[i](即right集)表示以i节点结尾的后缀出现的次数. 1 #include<cstdio> 2 #include<cstring> 3 #define F(i,a,b) for(int i=a;i<=b;++i) 4 #def

[BZOJ 1692] [Usaco2007 Dec] 队列变换 【后缀数组 + 贪心】

---恢复内容开始--- 题目链接:BZOJ - 1692 题目分析 首先,有个比较简单的贪心思路:如果当前剩余字符串的两端字母不同,就选取小的字母,这样显然是正确的. 然而若两端字母相同,我们怎么选取呢? 这时我们要从两端分别向内部比较,看那一端向内的字符串字典序小. 比如这个字符串 ABCDBA,从左端向内是 ABC.. 从右端向内是 ABD... 所以就选取左端的字符. 这样直接比较是 O(n^2) 的,我们可以使用后缀数组的 Rank 数组来比较. 我们在字符串后加上分隔符,然后再将字符

BZOJ 3230 相似子串 | 后缀数组 二分 ST表

BZOJ 3230 相似子串 题面 题解 首先我们要知道询问的两个子串的位置. 先正常跑一遍后缀数组并求出height数组. 对于每一个后缀suffix(i),考虑以i开头的子串有多少是之前没有出现过的,也就是考虑左端点在i.右端点在什么范围内时这个子串没有出现过--答案是右端点在[i + height[i] - 1, n]范围内时这个子串没出现过,即右端点在没有被"i与排在前一个的后缀的公共前缀"覆盖的部分时,这个子串没有出现过. 那么我们记录以每个i开头的新子串的数量,求前缀和,然

BZOJ 3238 AHOI 2013 差异 后缀数组+单调栈

题目大意: 思路:一看各种后缀那就是后缀数组没跑了. 求出sa,height之后就可以乱搞了.对于height数组中的一个值,height[i]来说,这个值能够作为lcp值的作用域只在左边第一个比他小的位置到右边第一个比他小的位置.这个东西很明显可以倍增RMQ+二分/单调栈. 之后就是数学题了 Σlen[Ti] + len[Tj] = (len + 1) * len * (len - 1),之后吧所有求出来的Σ2 * lcp(Ti,Tj)减掉就是答案. 记得答案开long long CODE:

后缀数组 hash求LCP BZOJ 4310: 跳蚤

后缀数组的题博客里没放进去过..所以挖了一题写写 充实下博客 顺便留作板子.. 一个字符串S中 内容不同的子串 有 sigma{n-sa[i]+1-h[i]}   (噢 这里的h[]就是大家熟知的height[]) 所以l=1,r=上述sigma 二分 答案是字典序第几大的子串. 然后 求S中第k大的子串W : 因为h[i]是与i-1有关的 所以要从n downto 1,k-=n-sa[i]+1-h[i] 至 k再减就非正了 显然这样扫过来 子串字典序是递减的  因此可以得到第k大子串W 然后再