http://poj.org/problem?id=3415
给定两个字符串A 和B,求长度不小于k 的公共子串的个数(可以相同)。
论文题,和上道题(POJ2774)类似,首先想到现将AB串合并,然后子串可以表示成字符串后缀的前缀,于是我们比较任意两个A后缀和B后缀,用height求出他们的公共子串长度就很好做了。
(不懂为什么好做的可以看SPOJ694)
那么最坏的想法就是每遇到B后缀就和前面遇到的A后缀比较,这样显然TLE,也没用到height数组的优越性。
但是我们A后缀可以用单调栈维护,这样复杂度即可。
(大致细节:对照代码,tot是暂时存答案的地方,当遇到height数组比单调栈顶小时开始弹出,同时高出height的部分要从tot被扣掉(注意要扣掉(二者之间的后缀数)次,因为他们都重复计算了),只有当A前缀出现的时候才能用tot更新ans)
同理再对A后缀做一遍如上操作,两次答案之和即为最终所求。
(感觉是懂了,还是迷迷糊糊的,可以看这个:https://www.cnblogs.com/CSU3901130321/p/4516109.html)
(其实最关键的是两个后缀的公共前缀是他们排名之间所有的height的最小值,所以一遇到变低的height就需要更新了,并且说明之前的所有都被多算了。)
#include<algorithm> #include<iostream> #include<cstring> #include<cctype> #include<cstdio> #include<vector> #include<queue> #include<cmath> using namespace std; typedef long long ll; const int N=2e5+10; char s[N]; int n,m,len,rank[N],sa[N],height[N],w[N]; inline bool pan(int *x,int i,int j,int k){ int ti=i+k<n?x[i+k]:-1; int tj=j+k<n?x[j+k]:-1; return x[i]==x[j]&&ti==tj; } inline void SA_init(){ int *x=rank,*y=height,r=256; for(int i=0;i<r;i++)w[i]=0; for(int i=0;i<n;i++)w[s[i]]++; for(int i=1;i<r;i++)w[i]+=w[i-1]; for(int i=n-1;i>=0;i--)sa[--w[s[i]]]=i; r=1;x[sa[0]]=0; for(int i=1;i<n;i++) x[sa[i]]=s[sa[i]]==s[sa[i-1]]?r-1:r++; for(int k=1;r<n;k<<=1){ int yn=0; for(int i=n-k;i<n;i++)y[yn++]=i; for(int i=0;i<n;i++) if(sa[i]>=k)y[yn++]=sa[i]-k; for(int i=0;i<r;i++)w[i]=0; for(int i=0;i<n;i++)++w[x[y[i]]]; for(int i=1;i<r;i++)w[i]+=w[i-1]; for(int i=n-1;i>=0;i--)sa[--w[x[y[i]]]]=y[i]; swap(x,y);r=1;x[sa[0]]=0; for(int i=1;i<n;i++) x[sa[i]]=pan(y,sa[i],sa[i-1],k)?r-1:r++; } for(int i=0;i<n;i++)rank[i]=x[i]; } inline void height_init(){ int i,j,k=0; for(i=1;i<=n;i++)rank[sa[i]]=i; for(i=0;i<n;i++){ if(k)k--; else k=0; j=sa[rank[i]-1]; while(s[i+k]==s[j+k])k++; height[rank[i]]=k; } } ll ans,tot; int q[N][2],top; ll solve(){ ans=tot=top=0; for(int i=1;i<=n;i++){ if(height[i]<m)top=tot=0; else{ int cnt=0; if(sa[i-1]<len)cnt++,tot+=height[i]-m+1; while(top>0&&height[i]<=q[top-1][0]){ top--; tot-=q[top][1]*(q[top][0]-height[i]); cnt+=q[top][1]; } q[top][0]=height[i];q[top++][1]=cnt; if(sa[i]>len)ans+=tot; } } tot=top=0; for(int i=1;i<=n;i++){ if(height[i]<m)top=tot=0; else{ int cnt=0; if(sa[i-1]>len)cnt++,tot+=height[i]-m+1; while(top>0&&height[i]<=q[top-1][0]){ top--; tot-=q[top][1]*(q[top][0]-height[i]); cnt+=q[top][1]; } q[top][0]=height[i];q[top++][1]=cnt; if(sa[i]<len)ans+=tot; } } return ans; } int main(){ while(scanf("%d",&m)!=EOF&&m){ scanf("%s",s); len=n=strlen(s); s[n++]=123; scanf("%s",s+n); n=strlen(s); s[n++]=0; SA_init(); n--; height_init(); printf("%lld\n",solve()); } return 0; }
+++++++++++++++++++++++++++++++++++++++++++
+本文作者:luyouqi233。 +
+欢迎访问我的博客:http://www.cnblogs.com/luyouqi233/+
+++++++++++++++++++++++++++++++++++++++++++
原文地址:https://www.cnblogs.com/luyouqi233/p/8467827.html