POJ 3415 Common Substrings(后缀数组+单调栈)

【题目链接】 http://poj.org/problem?id=3415

【题目大意】

  求出两个字符串长度大于k的公共子串的数目。

【题解】

  首先,很容易想到O(n2)的算法,将A串和B串加拼接符相连,
  做一遍后缀数组,把分别属于A和B的所有后缀匹配,LCP-k+1就是对答案的贡献,
  但是在这个基础上该如何优化呢。
  我们可以发现按照sa的顺序下来,每个后缀和前面的串的LCP就是区间LCP的最小值,
  那么我们维护一个单调栈,将所有单调递减的LCP值合并,
  保存数量和长度,对每个属于B串的后缀更新前面A串的后缀的贡献,
  对属于A串的后缀更新属于B串的后缀的贡献即可。

【代码】

#include <cstdio>
#include <cstring>
#include <algorithm>
using namespace std;
typedef long long ll;
const int N=400010;
int n,rank[N],sa[N],h[N],tmp[N],cnt[N];char s[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}
int na[N],nb[N],K,st[N],top;
int main(){
    while(~scanf("%d",&K),K){
        scanf(" %s",s);
        int len=strlen(s); s[len]=‘#‘;
        scanf(" %s",s+len+1);
        n=strlen(s);
        suffixarray(n,128);
        for(int i=2;i<=n;i++)h[i]=max(0,h[i]-K+1);
        ll ans=0,w1=0,w2=0; top=0;
        for(int i=2;i<=n;i++){
            st[++top]=h[i];
            if(sa[i-1]<len)na[top]=1,nb[top]=0,w1+=h[i];
            else na[top]=0,nb[top]=1,w2+=h[i];
            while((top>1)&&st[top]<=st[top-1]){
                w1-=na[top-1]*(st[top-1]-st[top]);
                w2-=nb[top-1]*(st[top-1]-st[top]);
                na[top-1]+=na[top]; nb[top-1]+=nb[top];
                st[top-1]=st[top--];
            }if(sa[i]<len)ans+=w2;
            else ans+=w1;
        }printf("%lld\n",ans);
    }return 0;
}

  

时间: 2024-10-03 21:54:36

POJ 3415 Common Substrings(后缀数组+单调栈)的相关文章

POJ - 3415 Common Substrings 后缀数组+单调栈

一般遇到多串问题,就用不同的符号把他们接起来,当成一个串来处理. 如A串是"aaaba",B串是"abaa". 把height数组按照不小于K分组,假设K = 2.从前向后扫描,对于每一组中的每个B,考虑前面A对其的贡献. 可以用栈来维护A的值.当要入栈的height值大于栈顶的值,统计得到的子串的数目 (+= height[i]-K+1). 如果小于,总和减去多加的部分,pop到小于height[i]为止,再入栈算贡献.

POJ - 3415 Common Substrings(后缀数组求长度不小于 k 的公共子串的个数+单调栈优化)

Description A substring of a string T is defined as: T( i, k)= TiTi+1... Ti+k-1, 1≤ i≤ i+k-1≤| T|. Given two strings A, B and one integer K, we define S, a set of triples (i, j, k): S = {( i, j, k) | k≥ K, A( i, k)= B( j, k)}. You are to give the val

POJ 3415 Common Substrings(后缀数组求重复字串)

题目大意:给你两个字符串,让你求出来两个字符串之间的重复子串长度大于k的有多少个. 解题思路: 先说论文上给的解释:基本思路是计算A的所有后缀和B的所有后缀之间的最长公共前缀的长度,把最长公共前缀长度不小于k的部分全部加起来.先将两个字符串连起来,中间用一个没有出现过的字符隔开.按height值分组后,接下来的工作便是快速的统计每组中后缀之间的最长公共前缀之和.扫描一遍,每遇到一个B的后缀就统计与前面的A的后缀能产生多少个长度不小于k的公共子串,这里A的后缀需要用一个单调的栈来高效的维护.然后对

POJ 3415 Common Substrings 后缀数组+并查集

后缀数组,看到网上很多题解都是单调栈,这里提供一个不是单调栈的做法, 首先将两个串 连接起来求height   求完之后按height值从大往小合并.  height值代表的是  sa[i]和sa[i-1] 的公共前缀长度,那么每次合并就是合并  i和i-1 那么在合并小的时候公共前缀更大的肯定已经都合并在一起,那么就可以直接统计了. #include<iostream> #include<cstdio> #include<algorithm> #include<

POJ 3415 Common Substrings ——后缀数组

[题目分析] 判断有多少个长度不小于k的相同子串的数目. N^2显然是可以做到的. 其实可以维护一个关于height的单调栈,统计一下贡献,就可以了. 其实还是挺难写的OTZ. [代码] #include <cstdio> #include <cstring> #include <cmath> #include <cstdlib> #include <map> #include <set> #include <queue>

POJ3415:Common Substrings(后缀数组+单调栈)

Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a set of triples (i, j, k): S = {(i, j, k) | k≥K, A(i, k)=B(j, k)}. You are to give the value of |S| f

poj Common Substrings(后缀数组&amp;单调队列)

Common Substrings Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 7082   Accepted: 2355 Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a

POJ 3415 Common Substrings (求长度不小于k的公共子串的个数)

Common Substrings Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 10002   Accepted: 3302 Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S,

HUID 5558 Alice&#39;s Classified Message 后缀数组+单调栈+二分

http://acm.hdu.edu.cn/showproblem.php?pid=5558 对于每个后缀suffix(i),想要在前面i - 1个suffix中找到一个pos,使得LCP最大.这样做O(n^2) 考虑到对于每一个suffix(i),最长的LCP肯定在和他排名相近的地方取得. 按排名大小顺序枚举位置,按位置维护一个递增的单调栈,对于每一个进栈的元素,要算一算栈内元素和他的LCP最大是多少. 如果不需要输出最小的下标,最大的直接是LCP(suffix(st[top]),  suff

【bzoj3238】[Ahoi2013]差异 后缀数组+单调栈

题目描述 输入 一行,一个字符串S 输出 一行,一个整数,表示所求值 样例输入 cacao 样例输出 54 题解 后缀数组+单调栈,几乎同 bzoj3879 的后半部分. 我明显是做题做反了... 这里还是说一下这道题的做法. 先用后缀数组求出height. 然后由于有LCP(a,c)=min(LCP(a,b),LCP(b,c))(rank[a]<rank[b]<rank[c]),所以我们只需要知道排名相邻的两个后缀的LCP,而这就是height数组的定义. 转化为子问题:给出n个数,求所有子