题意:给两个字符串,求一个最短的子串。使得这个子串在两个字符串中出现的次数都等于1.出现的定义为:可以重叠的出现。
解法:后缀数组的应用。从小枚举长度。如果一个长度len合法的话:则一定存在这个样的sa[i]排名。sa[i]与s[i+1]的公共前缀长度大于等于len,且sa[i]与[i-1]的公共前缀长度小于len,同时sa[i+1]与[i+2]的公共前缀长度小于len,同时保证sa[i]与sa[i+1]在两个串中。Judge函数就是技巧性地实现了这些判断。
代码:
#include<iostream> #include<string> #include <cstring> #include <string.h> #include <stdio.h> using namespace std; const int MAX = 200100; int n, num[MAX]; int sa[MAX], Rank[MAX], height[MAX];//sa[i]表示排名第i的后缀的位置,height[i]表示后缀SA[i]和SA[i-1]的最长公共前缀 int wa[MAX], wb[MAX], wv[MAX], wd[MAX];//名次数组 Rank[i] 保存的是 Suffix(i) 在所有后缀中从小到大排列的 “ 名次 ” 。 //简单的说,后缀数组(SA)是 “ 排第几的是谁? ” ,名次数组(RANK)是 “ 你排第几? ” 。 容易看出,后缀数组和名次数组为互逆运算。 int cmp(int *r, int a, int b, int l) { return r[a] == r[b] && r[a+l] == r[b+l]; } void da(int *r, int n, int m) // 倍增算法0(nlgn)。 { int i, j, p, *x = wa, *y = wb, *t; for(i = 0; i < m; i ++) wd[i] = 0; for(i = 0; i < n; i ++) wd[x[i]=r[i]] ++; for(i = 1; i < m; i ++) wd[i] += wd[i-1]; for(i = n-1; i >= 0; i --) sa[-- wd[x[i]]] = i; for(j = 1, p = 1; p < n; j *= 2, m = p) { for(p = 0, i = n-j; i < n; i ++) y[p ++] = i; for(i = 0; i < n; i ++) if(sa[i] >= j) y[p ++] = sa[i] - j; for(i = 0; i < n; i ++) wv[i] = x[y[i]]; for(i = 0; i < m; i ++) wd[i] = 0; for(i = 0; i < n; i ++) wd[wv[i]] ++; for(i = 1; i < m; i ++) wd[i] += wd[i-1]; for(i = n-1; i >= 0; i --) sa[-- wd[wv[i]]] = y[i]; for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; i ++) { x[sa[i]] = cmp(y, sa[i-1], sa[i], j) ? p - 1: p ++; } } } void calHeight(int *r, int n) // 求height数组。 { int i, j, k = 0; for(i = 0; i < n; i ++) Rank[sa[i]] = i; for(i = 0; i < n; height[Rank[i ++]] = k) { for(k ? k -- : 0, j = sa[Rank[i]-1]; r[i+k] == r[j+k]; k ++); } } int len1=0; int len2=0; char s1[10000]; char s2[10000]; bool Judge(int n,int k) { int a = 0,b = 0; for(int i = 0;i < n;i++) { if(height[i] < k) { if(a == 1 && b == 1) return 1; a = b = 0; } if(sa[i] >= 0 && sa[i] < len1) a++; if(sa[i] > len1 && sa[i] < n-1) b++; } return 0; } int main() { scanf("%s%s",s1,s2); len1=strlen(s1); len2=strlen(s2); for(int i=0; i<len1; i++) num[i]=s1[i]-‘a‘+1; num[len1]=28; for(int i=0; i<len2; i++) num[i+len1+1]=s2[i]-‘a‘+1; da(num,len1+len2+2,30); calHeight(num,len1+len2+2); int len=min(len1,len2); int ans=-1; for(int i=1; i<=len; i++) { if(Judge(len1+len2+2,i)) { ans=i; break; } } cout<<ans<<endl; return 0; } //20 5 19 20 19 5 20 19 5 19 28 20 5 5 16 20 5 19 0 0 0
CF(427D-Match & Catch)后缀数组应用
时间: 2024-10-16 12:56:55