POJ 1743 Musical Theme (后缀数组,求最长不重叠重复子串)


有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。







本题中利用height 值对后缀进行分组的方法很常用。

//704K	250MS
using namespace std;

const int MAXN=20010;
const int inf = 0x3f3f3f3f;
int t1[MAXN],t2[MAXN],c[MAXN];//求SA数组需要的中间变量,不需要赋值

bool cmp(int *r,int a,int b,int l)
    return r[a] == r[b] && r[a+l] == r[b+l];

void da(int str[],int sa[],int rank[],int height[],int n,int m)
    int i, j, p, *x = t1, *y = t2;
    for(i = 0;i < m;i++) c[i] = 0;
    for(i = 0;i < n;i++) c[x[i] = str[i]]++;
    for(i = 1;i < m;i++) c[i] += c[i-1];
    for(i = n-1;i >= 0;i--) sa[--c[x[i]]] = i;
    for(j = 1;j <= n; j <<= 1)
        p = 0;
        for(i = n-j; i < n; i++) y[p++] = i;//后面的j个数第二关键字为空的最小
        for(i = 0; i < n; i++) if(sa[i] >= j) y[p++] = sa[i] - j;
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[y[i]]]++;
        for(i = 1; i < m;i++) c[i] += c[i-1];
        for(i = n-1; i >= 0;i--) sa[--c[x[y[i]]]] = y[i];
        p = 1; x[sa[0]] = 0;
        for(i = 1;i < n;i++)
            x[sa[i]] = cmp(y,sa[i-1],sa[i],j)?p-1:p++;
        if(p >= n) break;
        m = p;//下次基数排序的最大值
    int k = 0;
    for(i = 0;i <= n;i++) rank[sa[i]] = i;
    for(i = 0;i < n;i++)
        if(k) k--;
        j = sa[rank[i]-1];
        while(str[i+k] == str[j+k]) k++;
        height[rank[i]] = k;

int rank[MAXN],height[MAXN];

int r[MAXN];
int sa[MAXN];
bool ok(int x,int n)
    int maxn=sa[1],minn=sa[1];
    for(int rnk=2;rnk<=n;rnk++)
            if(maxn-minn>=x) return true;
        else maxn=sa[rnk],minn=sa[rnk];
    return false;
int main()
    int n;
        for(int i=0;i<n;i++) scanf("%d",&r[i]);
        for(int i=0;i<n-1;i++) r[i]=r[i+1]-r[i]+90;
        int lb=0,ub=n/2+1;//二分区间定在题意区间外[1,n/2]
            int mid=(lb+ub)>>1;
            if(ok(mid,n)) lb=mid;
            else ub=mid;
        if(lb<4) printf("0\n");
        else printf("%d\n",lb+1);
    return 0;
