题意:求字符串中不同子串的个数。
解题关键:每个子串一定是某个后缀的前缀,那么原问题等价于求所有后缀之间的不相同的前缀的个数。
1、总数减去height数组的和即可。
注意这里height中为什么不需要进行组合计数,因为,每一个height的左端点已经确定,所以只需变动右端点,总共$height[i]$种情况。
2、如果所有的后缀按照 suffix(sa[1]), suffix(sa[2]),suffix(sa[3]), …… ,suffix(sa[n])的顺序计算,不难发现,对于每一次新加进来的后缀 suffix(sa[k]),它将产生 n-sa[k]+1 个新的前缀。但是其中有height[k]个是和前面的字符串的前缀是相同的。所以 suffix(sa[k])将“贡献”出 n-sa[k]+1- height[k]个不同的子串。累加后便是原问题的答案。这个做法的时间复杂度为 O(n)。
1 #include <cstdlib> 2 #include <cstring> 3 #include <cstdio> 4 #include <algorithm> 5 #include<iostream> 6 #include<cmath> 7 #define inf 0x3f3f3f3f 8 typedef long long ll; 9 using namespace std; 10 const int N=200005; 11 int wa[N],wb[N],wv[N],wc[N]; 12 bool cmp(int *r,int a,int b,int l){return r[a]==r[b]&&r[a+l]==r[b+l];} 13 void make_sa(int *r,int *sa,int n,int m){ 14 int i,j,p,*x=wa,*y=wb; 15 for(i=0;i<m;i++) wc[i]=0; 16 for(i=0;i<n;i++) wc[x[i]=r[i]]++; 17 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 18 for(i=n-1;i>=0;i--) sa[--wc[x[i]]]=i; 19 for(j=1,p=1;p<n;j*=2,m=p){ 20 for(p=0,i=n-j;i<n;i++) y[p++]=i; 21 for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j; 22 for(i=0;i<n;i++) wv[i]=x[y[i]]; 23 for(i=0;i<m;i++) wc[i]=0; 24 for(i=0;i<n;i++) wc[wv[i]]++; 25 for(i=1;i<m;i++) wc[i]+=wc[i-1]; 26 for(i=n-1;i>=0;i--) sa[--wc[wv[i]]]=y[i]; 27 for(swap(x,y),p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; 28 } 29 return; 30 } 31 int rank1[N],height[N],sa[N]; 32 void make_height(int *r,int *sa,int n){ 33 int i,j,k=0; 34 for(i=1;i<=n;i++) rank1[sa[i]]=i; 35 for(i=0;i<n;height[rank1[i++]]=k) 36 for(k?k--:0,j=sa[rank1[i]-1];r[i+k]==r[j+k];k++); 37 return; 38 } 39 40 int n,k,r[N]; 41 int main(){ 42 int t; 43 ios::sync_with_stdio(0); 44 cin>>t; 45 while(t--){ 46 string s; 47 cin>>s; 48 for(int i=0;i<s.size();i++) r[i]=(int)s[i]; 49 r[s.size()]=0; 50 n=s.size(); 51 make_sa(r,sa,n+1,129); 52 make_height(r,sa,n); 53 ll sum=s.size()*(s.size()+1)/2; 54 for(int i=2;i<=n;i++){ 55 sum-=height[i]; 56 } 57 cout<<sum<<"\n"; 58 } 59 return 0; 60 }
时间: 2024-10-06 18:11:42