[Noi2016]优秀的拆分
题目
如果一个字符串可以被拆分为 AABB的形式,其中 AA 和 BB 是任意非空字符串,则我们称该字符串的这种拆分是优秀的。例如,对于字符串 aabaabaa,如果令 A=aab,B=a,我们就找到了这个字符串拆分成 AABB的一种方式。一个字符串可能没有优秀的拆分,也可能存在不止一种优秀的拆分。比如我们令 A=a,B=baa,也可以用 AABB表示出上述字符串;但是,字符串 abaabaa 就没有优秀的拆分。现在给出一个长度为 n 的字符串 S,我们需要求出,在它所有子串的所有拆分方式中,优秀拆分的总个数。这里的子串是指字符串中连续的一段。
以下事项需要注意:
出现在不同位置的相同子串,我们认为是不同的子串,它们的优秀拆分均会被记入答案。在一个拆分中,允许出现 A=B。例如 cccc 存在拆分 A=B=c。字符串本身也是它的一个子串。
INPUT
每个输入文件包含多组数据。输入文件的第一行只有一个整数 T,表示数据的组数。保证 1≤T≤10。接下来 T 行,每行包含一个仅由英文小写字母构成的字符串 S,意义如题所述。N≤30000
OUTPUT
输出 T 行,每行包含一个整数,表示字符串 S 所有子串的所有拆分中,总共有多少个是优秀的拆分。
SAMPLE
INPUT
4
aabbbb
cccccc
aabaabaabaa
bbaabaababaaba
OUTPUT
3
5
4
7
解题报告
$SA$的力量= =
显然我们不用处理什么$AABB$,只需要去处理所有$AA$形式,再去统计答案即可
设$pre[i]$表示以$i$这个字符开头的$AA$型子串的数目
设$nxt[i]$表示以$i$这个字符结尾的$AA$型子串的数目
则答案$ans=\sum _{i=1}^{n-1}pre[i+1]\times nxt[i]$
所以问题就转化成了求$AA$型的子串
我们可以枚举找的$AA$型子串长度的一半,去判断$lcp$与$lcs$
枚举$i=k*len$,$j=i+len$
设$x=lcp(suffix(i),suffix(j))$,$y=lcs(pre(i-1),pre(j-1))$
若$x+y\geqslant len$,那么我们就找到了$x+y-len+1$个长度为$2\times len$的$AA$串
差分一下就$GG$了
1 #include<iostream> 2 #include<cstring> 3 #include<cstdio> 4 using namespace std; 5 #define mem(x) memset((x),0,sizeof((x))) 6 struct SA{ 7 char s[60005]; 8 int n,m; 9 int t1[60005],t2[60005],t3[60005],buc[60005]; 10 int sa[60005],Rank[60005],height[60005],mn[60005][20]; 11 SA(){} 12 inline void clear(){ 13 m=130; 14 mem(t1),mem(t2),mem(t3),mem(buc),mem(sa),mem(Rank),mem(height),mem(mn); 15 } 16 inline void init(){ 17 scanf("%s",s+1); 18 n=strlen(s+1); 19 } 20 inline void Suffix(){ 21 int i,j,k(0),p(0),*x(t1),*y(t2),*t; 22 for(i=0;i<=m;++i)buc[i]=0; 23 for(i=1;i<=n;++i)++buc[x[i]=s[i]]; 24 for(i=1;i<=m;++i)buc[i]+=buc[i-1]; 25 for(i=n;i>=1;--i)sa[buc[x[i]]--]=i; 26 for(j=1;p<n;j<<=1,m=p){ 27 for(p=0,i=n-j+1;i<=n;++i)y[++p]=i; 28 for(i=1;i<=n;++i) 29 if(sa[i]>j) 30 y[++p]=sa[i]-j; 31 for(i=0;i<=m;++i)buc[i]=0; 32 for(i=1;i<=n;++i)t3[i]=x[y[i]]; 33 for(i=1;i<=n;++i)++buc[t3[i]]; 34 for(i=1;i<=m;++i)buc[i]+=buc[i-1]; 35 for(i=n;i>=1;--i)sa[buc[t3[i]]--]=y[i]; 36 for(t=x,x=y,y=t,x[sa[1]]=1,p=1,i=2;i<=n;++i) 37 x[sa[i]]=((y[sa[i]]==y[sa[i-1]])&&(y[sa[i]+j]==y[sa[i-1]+j]))?p:++p; 38 } 39 for(i=1;i<=n;++i)Rank[sa[i]]=i; 40 for(i=1;i<=n;height[Rank[i++]]=k) 41 for(k?--k:0,j=sa[Rank[i]-1];s[i+k]==s[j+k];++k); 42 } 43 inline void ST(){ 44 for(int i=1;i<=n;++i)mn[i][0]=height[i]; 45 for(int i=1;(1<<i)<=n;++i) 46 for(int j=1;j+(1<<i)-1<=n;++j) 47 mn[j][i]=min(mn[j][i-1],mn[j+(1<<i-1)][i-1]); 48 } 49 inline int lcp(int x,int y){ 50 if(y>n)return 0; 51 x=Rank[x],y=Rank[y]; 52 if(x>y)swap(x,y); 53 ++x; 54 int k(0),len(y-x+1); 55 while((1<<k)<=len)++k; 56 --k; 57 return min(mn[x][k],mn[y-(1<<k)+1][k]); 58 } 59 inline void work(){ 60 Suffix(); 61 ST(); 62 } 63 }a,b; 64 inline void inv(){ 65 b.n=a.n; 66 for(int i=1;i<=a.n;++i) 67 b.s[i]=a.s[a.n-i+1]; 68 } 69 typedef long long L; 70 L ans; 71 L cnt1[30005],cnt2[30005]; 72 inline void doit(){ 73 ans=0; 74 mem(cnt1),mem(cnt2); 75 int edge(a.n>>1); 76 for(int l=1;l<=edge;++l) 77 for(int i=l,j=l<<1;j<=a.n;i+=l,j+=l){ 78 int x(min(a.lcp(i,j),l)); 79 int y(min(b.lcp(a.n-(i-1)+1,a.n-(j-1)+1),l-1)); 80 int tmp(x+y-l+1); 81 if(x+y>=l){ 82 ++cnt1[i-y];--cnt1[i-y+tmp]; 83 ++cnt2[j+x-tmp];--cnt2[j+x]; 84 } 85 } 86 for(int i=1;i<=a.n;++i) 87 cnt1[i]+=cnt1[i-1],cnt2[i]+=cnt2[i-1]; 88 for(int i=1;i<=a.n;++i) 89 ans+=cnt1[i+1]*cnt2[i]; 90 printf("%lld\n",ans); 91 } 92 int main(){ 93 int T; 94 scanf("%d",&T); 95 while(T--){ 96 a.clear(),b.clear(); 97 a.init(); 98 a.work(); 99 inv(); 100 b.work(); 101 doit(); 102 } 103 }