POJ3415:Common Substrings——题解

http://poj.org/problem?id=3415

给定两个字符串A 和B,求长度不小于k 的公共子串的个数(可以相同)。

论文题,和上道题(POJ2774)类似,首先想到现将AB串合并,然后子串可以表示成字符串后缀的前缀,于是我们比较任意两个A后缀和B后缀,用height求出他们的公共子串长度就很好做了。

(不懂为什么好做的可以看SPOJ694

那么最坏的想法就是每遇到B后缀就和前面遇到的A后缀比较,这样显然TLE,也没用到height数组的优越性。

但是我们A后缀可以用单调栈维护,这样复杂度即可。

(大致细节:对照代码,tot是暂时存答案的地方,当遇到height数组比单调栈顶小时开始弹出,同时高出height的部分要从tot被扣掉(注意要扣掉(二者之间的后缀数)次,因为他们都重复计算了),只有当A前缀出现的时候才能用tot更新ans)

同理再对A后缀做一遍如上操作,两次答案之和即为最终所求。

(感觉是懂了,还是迷迷糊糊的,可以看这个:https://www.cnblogs.com/CSU3901130321/p/4516109.html

(其实最关键的是两个后缀的公共前缀是他们排名之间所有的height的最小值,所以一遇到变低的height就需要更新了,并且说明之前的所有都被多算了。)

#include<algorithm>
#include<iostream>
#include<cstring>
#include<cctype>
#include<cstdio>
#include<vector>
#include<queue>
#include<cmath>
using namespace std;
typedef long long ll;
const int N=2e5+10;
char s[N];
int n,m,len,rank[N],sa[N],height[N],w[N];
inline bool pan(int *x,int i,int j,int k){
    int ti=i+k<n?x[i+k]:-1;
    int tj=j+k<n?x[j+k]:-1;
    return x[i]==x[j]&&ti==tj;
}
inline void SA_init(){
    int *x=rank,*y=height,r=256;
    for(int i=0;i<r;i++)w[i]=0;
    for(int i=0;i<n;i++)w[s[i]]++;
    for(int i=1;i<r;i++)w[i]+=w[i-1];
    for(int i=n-1;i>=0;i--)sa[--w[s[i]]]=i;
    r=1;x[sa[0]]=0;
    for(int i=1;i<n;i++)
    x[sa[i]]=s[sa[i]]==s[sa[i-1]]?r-1:r++;
    for(int k=1;r<n;k<<=1){
    int yn=0;
    for(int i=n-k;i<n;i++)y[yn++]=i;
    for(int i=0;i<n;i++)
        if(sa[i]>=k)y[yn++]=sa[i]-k;
        for(int i=0;i<r;i++)w[i]=0;
        for(int i=0;i<n;i++)++w[x[y[i]]];
        for(int i=1;i<r;i++)w[i]+=w[i-1];
        for(int i=n-1;i>=0;i--)sa[--w[x[y[i]]]]=y[i];
        swap(x,y);r=1;x[sa[0]]=0;
        for(int i=1;i<n;i++)
            x[sa[i]]=pan(y,sa[i],sa[i-1],k)?r-1:r++;
    }
    for(int i=0;i<n;i++)rank[i]=x[i];
}
inline void height_init(){
    int i,j,k=0;
    for(i=1;i<=n;i++)rank[sa[i]]=i;
    for(i=0;i<n;i++){
        if(k)k--;
        else k=0;
        j=sa[rank[i]-1];
        while(s[i+k]==s[j+k])k++;
        height[rank[i]]=k;
    }
}
ll ans,tot;
int q[N][2],top;
ll solve(){
    ans=tot=top=0;
    for(int i=1;i<=n;i++){
        if(height[i]<m)top=tot=0;
        else{
            int cnt=0;
            if(sa[i-1]<len)cnt++,tot+=height[i]-m+1;
            while(top>0&&height[i]<=q[top-1][0]){
                top--;
                tot-=q[top][1]*(q[top][0]-height[i]);
                cnt+=q[top][1];
            }
            q[top][0]=height[i];q[top++][1]=cnt;
            if(sa[i]>len)ans+=tot;
        }
    }
    tot=top=0;
    for(int i=1;i<=n;i++){
        if(height[i]<m)top=tot=0;
        else{
            int cnt=0;
            if(sa[i-1]>len)cnt++,tot+=height[i]-m+1;
            while(top>0&&height[i]<=q[top-1][0]){
                top--;
                tot-=q[top][1]*(q[top][0]-height[i]);
                cnt+=q[top][1];
            }
            q[top][0]=height[i];q[top++][1]=cnt;
            if(sa[i]<len)ans+=tot;
        }
    }
    return ans;
}
int main(){
    while(scanf("%d",&m)!=EOF&&m){
        scanf("%s",s);
        len=n=strlen(s);
        s[n++]=123;
        scanf("%s",s+n);
        n=strlen(s);
        s[n++]=0;
        SA_init();
        n--;
        height_init();
        printf("%lld\n",solve());
    }
    return 0;
}

+++++++++++++++++++++++++++++++++++++++++++

+本文作者:luyouqi233。               +

+欢迎访问我的博客:http://www.cnblogs.com/luyouqi233/+

+++++++++++++++++++++++++++++++++++++++++++

原文地址:https://www.cnblogs.com/luyouqi233/p/8467827.html

时间: 2024-07-31 03:41:55

POJ3415:Common Substrings——题解的相关文章

poj3415 Common Substrings(后缀数组,单调栈)

Common Substrings Time Limit: 5000MS Memory Limit: 65536K Total Submissions: 8748 Accepted: 2899 Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a set

POJ3415:Common Substrings(后缀数组+单调栈)

Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a set of triples (i, j, k): S = {(i, j, k) | k≥K, A(i, k)=B(j, k)}. You are to give the value of |S| f

poj3415 Common Substrings(后缀自动机)

A substring of a string T is defined as:   T( i, k)= TiTi +1... Ti+k -1, 1≤ i≤ i+k-1≤| T|.   Given two strings A, B and one integer K, we define S, a set of triples (i, j, k):   S = {( i, j, k) | k≥ K, A( i, k)= B( j, k)}.   You are to give the value

POJ 3415 Common Substrings (求长度不小于k的公共子串的个数)

Common Substrings Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 10002   Accepted: 3302 Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S,

字符串(后缀数组):POJ 3415 Common Substrings

Common Substrings Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a set of triples (i, j, k): S = {(i, j, k) | k≥K, A(i, k)=B(j, k)}. You are to give

POJ 3415 Common Substrings

Common Substrings Time Limit: 5000ms Memory Limit: 65536KB This problem will be judged on PKU. Original ID: 341564-bit integer IO format: %lld      Java class name: Main A substring of a string T is defined as: \[T(i, k)=T_iT_{i+1}\dots T_{i+k-1}, 1\

LeetCode: Longest Common Prefix 题解

Write a function to find the longest common prefix string amongst an array of strings. 题解: 寻找一组字符串的最长公共前缀.  最简单的方法,用一个字符串记录当前最长的公共前缀,然后依次比较.时间复杂度: O(N). 1 class Solution { 2 public: 3 string getPrefix(string a,string b) // 辅助函数用于获取两个字符串的公共前缀 4 { 5 st

POJ 题目3415 Common Substrings(后缀数组+栈,求可以匹配到的长度大于k的公共子串个数)

Common Substrings Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 8471   Accepted: 2798 Description A substring of a string T is defined as: T(i, k)=TiTi+1...Ti+k-1, 1≤i≤i+k-1≤|T|. Given two strings A, B and one integer K, we define S, a

POJ 3415 Common Substrings(后缀数组求重复字串)

题目大意:给你两个字符串,让你求出来两个字符串之间的重复子串长度大于k的有多少个. 解题思路: 先说论文上给的解释:基本思路是计算A的所有后缀和B的所有后缀之间的最长公共前缀的长度,把最长公共前缀长度不小于k的部分全部加起来.先将两个字符串连起来,中间用一个没有出现过的字符隔开.按height值分组后,接下来的工作便是快速的统计每组中后缀之间的最长公共前缀之和.扫描一遍,每遇到一个B的后缀就统计与前面的A的后缀能产生多少个长度不小于k的公共子串,这里A的后缀需要用一个单调的栈来高效的维护.然后对