题目大意:
给出一个A串和很多个B串,求出A中有多少个子串,是所有的B中没有出现的。
思路分析:
后缀数组的作用很容易的求出来整个串中不同的子串个数。
现在要求的是A中不同的,且在B中没有出现过的。
先把AB 串全部连接,跑一遍suffix array。然后求出有多少个不同的子串。
然后再单独用B 串跑 suffix array。再求出单独在B 中有多少个不同的 子串。
然后结果就是 ans1 - ans2 ...
需要注意的问题就是,连接的时候需要把每一个串后面加一个特殊符。但是求不同串的时候是不能算进去的。
所以要进行一些判断。
#include <cstdio> #include <iostream> #include <cstring> #include <algorithm> #include <vector> #define lson num<<1,s,mid #define rson num<<1|1,mid+1,e #define maxn 311005 #define inf 0x3f3f3f3f using namespace std; typedef long long ll; int str[maxn<<1]; int sa[maxn],t1[maxn],t2[maxn],c[maxn]; void suffix(int n,int m) { int *x=t1,*y=t2; for(int i=0; i<m; i++)c[i]=0; for(int i=0; i<n; i++)c[x[i]=str[i]]++; for(int i=1; i<m; i++)c[i]+=c[i-1]; for(int i=n-1; i>=0; i--)sa[--c[x[i]]]=i; for(int k=1; k<=n; k<<=1) { int p=0; for(int i=n-k; i<n; i++)y[p++]=i; for(int i=0; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k; for(int i=0; i<m; i++)c[i]=0; for(int i=0; i<n; i++)c[x[y[i]]]++; for(int i=0; i<m; i++)c[i]+=c[i-1]; for(int i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i]; swap(x,y); p=1; x[sa[0]]=0; for(int i=1; i<n; i++) x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++; if(p>=n)break; m=p; } } int rank[maxn],height[maxn]; void getheight(int n) { int k=0; for(int i=0; i<n; i++)rank[sa[i]]=i; for(int i=0; i<n; i++) { if(k)k--; if(!rank[i])continue; int j=sa[rank[i]-1]; while(str[i+k]==str[j+k])k++; height[rank[i]]=k; } } char tmp[maxn]; int dex[maxn]; int len[maxn]; int main() { int T,CASE=1; scanf("%d",&T); int tp; while(T--) { memset(dex,0x3f,sizeof dex); memset(len,0,sizeof len); tp=0; int N; scanf("%d",&N); scanf("%s",tmp); len[1] = strlen(tmp); for(int j=0;j<len[1];j++) { dex[tp]=1; str[tp++]=tmp[j]; } str[tp++]=1+128; for(int i=2;i<=N+1;i++) { scanf("%s",tmp); len[i]=strlen(tmp); for(int j=0;j<len[i];j++) { dex[tp]=i; str[tp++]=tmp[j]; } str[tp++]=i+128; len[i]=tp-1; } str[tp-1]=0; suffix(tp,N+200); getheight(tp);//对AB串进行处理 ll ans=0; for(int i=1;i<tp;i++) { if(dex[sa[i]]!=inf) ans+=len[dex[sa[i]]]-sa[i]-height[i]; } for(int i=len[1]+1;i<tp;i++) { str[i-len[1]-1]=str[i]; dex[i-len[1]-1]=dex[i]; } for(int i=2;i<=N+1;i++) len[i]-=len[1]+1; tp-=len[1]+1; suffix(tp,N+200); getheight(tp);//对B串单独进行处理 ll tans = 0; for(int i=1;i<tp;i++) { if(dex[sa[i]]!=inf) tans+=len[dex[sa[i]]]-sa[i]-height[i]; } printf("Case %d: %I64d\n",CASE++,ans-tans); } return 0; }
hdu 4416 Good Article Good sentence (后缀数组),布布扣,bubuko.com
时间: 2024-10-12 07:18:36