后缀数组水题
先求所有的子串数,根据长度枚举,共(n+1)*n/2种
当height[i]>0时,说明height[i]这个前缀与其他子串相同,减去这height[i]个子串
#include<stdio.h> #include<string.h> #include<algorithm> using namespace std; #define N 1005 int r[N],sa[N],height[N],rank[N],wa[N],wb[N],wv[N],ws[N]; char s[N]; int n; int cmp(int *r,int a,int b,int l) {//因为长<l的字符串排名已经确定下来了,所以相邻的两个字符串如果首尾相同,则这两个字符串对于长为l而言是相同的 return r[a]==r[b]&&r[a+l]==r[b+l]; } void da(char *r,int *sa,int n,int m){ int i,j,p,*x=wa,*y=wb; for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[x[i]=r[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i; for(j=1,p=1;p<n;m=p,j<<=1){//每一次循环完了之后,sa存的都是某一长度的字符串的字典序排名 for(i=n-j,p=0;i<n;i++) y[p++]=i;//第二关键字都为0 for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;//第二关键字的位置 for(i=0;i<n;i++) wv[i]=x[y[i]];//把第一关键字按第二关键的顺序存储 for(i=0;i<m;i++) ws[i]=0; for(i=0;i<n;i++) ws[wv[i]]++; for(i=1;i<m;i++) ws[i]+=ws[i-1]; for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];//第一关键字重新排名,仍然按第二关键字的顺序存储 swap(x,y); for(p=1,x[sa[0]]=0,i=1;i<n;i++) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++; } return; } void calheight(char *r,int *sa,int n) { int i,j,k=0; for(i=1;i<=n;i++) rank[sa[i]]=i;//i是排名 for(i=0;i<n;height[rank[i++]]=k) for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++); //for(i=1;i<=n;i++) printf("height[%d]: %d\n",i,height[i]); return; } int main(){ #ifndef ONLINE_JUDGE freopen("in.txt","r",stdin); #endif int T; scanf("%d",&T); while(T--){ scanf("%s",s); n=strlen(s); for(int i=0;i<n;i++){ r[i]=s[i]; } r[n]=0; da(s,sa,n+1,129); calheight(s,sa,n); int ans=(n+1)*n/2; for(int i=1;i<=n;i++) ans-=height[i]; printf("%d\n",ans); } }
时间: 2024-10-17 07:08:44