[POI2000]公共串 - 后缀数组

Description

求若干个串的最长的公共子串的长度。

Solution

考虑将这若干个串全部拼起来,中间用一些不在字符集内的符号隔开。

然后二分答案 \(K\),如果连续的一段 \(height\) 都大于等于 \(K\),且每个串都出现了至少一次,则是可行的。

Code

#include <bits/stdc++.h>
using namespace std;

const int _ = 1e5 + 10;
int N, n, s[_], belong[_];
int rnk[_], sa[_], height[_];
char str[_];

void SA() {
    static int t[_], a[_], buc[_], fir[_], sec[_], tmp[_];
    copy(s + 1, s + N + 1, t + 1);
    sort(t + 1, t + N + 1);
    int *end = unique(t + 1, t + N + 1);
    for (int i = 1; i <= N; ++i) a[i] = lower_bound(t + 1, end, s[i]) - t;
    fill(buc + 1, buc + N + 1, 0);
    for (int i = 1; i <= N; ++i) ++buc[a[i]];
    for (int i = 1; i <= N; ++i) buc[i] += buc[i - 1];
    for (int i = 1; i <= N; ++i) rnk[i] = buc[a[i] - 1] + 1;
    for (int len = 1; len <= N; len <<= 1) {
        for (int i = 1; i <= N; ++i) {
            fir[i] = rnk[i];
            sec[i] = i + len > N ? 0 : rnk[i + len];
        }
        fill(buc + 1, buc + N + 1, 0);
        for (int i = 1; i <= N; ++i) ++buc[sec[i]];
        for (int i = 1; i <= N; ++i) buc[i] += buc[i - 1];
        for (int i = 1; i <= N; ++i) tmp[N - --buc[sec[i]]] = i;
        fill(buc + 1, buc + N + 1, 0);
        for (int i = 1; i <= N; ++i) ++buc[fir[i]];
        for (int i = 1; i <= N; ++i) buc[i] += buc[i - 1];
        for (int i, j = 1; j <= N; ++j) {
            i = tmp[j];
            sa[buc[fir[i]]--] = i;
        }
        bool same = false;
        for (int i, j = 1, last = 0; j <= N; ++j) {
            i = sa[j];
            if (!last) rnk[i] = 1;
            else if (fir[i] == fir[last] && sec[i] == sec[last])
                rnk[i] = rnk[last], same = true;
            else rnk[i] = rnk[last] + 1;
            last = i;
        }
        if (!same) break;
    }
    for (int i = 1, k = 0; i <= N; ++i) {
        if (rnk[i] == 1) k = 0;
        else {
            if (k > 0) --k;
            int j = sa[rnk[i] - 1];
            while (i + k <= N && j + k <= N && a[i + k] == a[j + k]) ++k;
        }
        height[rnk[i]] = k;
    }
}

bool check(int k) {
    static int vis[_], tot = 0;
    int cnt = 0;
    ++tot;
    for (int i = 1; i <= N; ++i) {
        if (height[i] < k) cnt = 0, ++tot;
        else {
            if (vis[belong[sa[i]]] != tot)
                vis[belong[sa[i]]] = tot, ++cnt;
            if (vis[belong[sa[i - 1]]] != tot)
                vis[belong[sa[i - 1]]] = tot, ++cnt;
            if (cnt == n) return true;
        }
    }
    return false;
}

int main() {
#ifndef ONLINE_JUDGE
    freopen("string.in", "r", stdin);
    freopen("string.out", "w", stdout);
#endif
    scanf("%d", &n);
    int now = 0;
    for (int i = 1; i <= n; ++i) {
        ++now;
        scanf("%s", str);
        int len = strlen(str);
        for (int j = now; j <= now + len - 1; ++j)
            s[j] = str[j - now] - 'a' + 1, belong[j] = i;
        now += len - 1;
        s[++now] = i + 26;
    }
    N = now;
    SA();
    int l = 0, r = N;
    while (l < r) {
        int mid = (l + r + 1) >> 1;
        if (check(mid)) l = mid;
        else r = mid - 1;
    }
    printf("%d\n", l);
    return 0;
}

原文地址:https://www.cnblogs.com/newbielyx/p/12160645.html

时间: 2024-10-03 03:13:57

[POI2000]公共串 - 后缀数组的相关文章

[BZOJ2946][Poi2000]公共串 后缀自动机

2946: [Poi2000]公共串 Time Limit: 3 Sec  Memory Limit: 128 MBSubmit: 1367  Solved: 612[Submit][Status][Discuss] Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单词 l        计算最长公共子串的长度 l        输出结果 Input 文件的第一行是整数 n,1<=n<=5,表示单词的数量.接下来n行每行一个单词

BZOJ 2946 POI2000 公共串 后缀自动机(多串最长公共子串)

题意概述:给出N个字符串,每个串的长度<=2000(雾...可能是当年的年代太久远机子太差了),问这N个字符串的最长公共子串长度为多少.(N<=5) 抛开数据结构,先想想朴素做法. 设计一种稳定的暴力算法.可以想到这样一种做法:首先确定一个串,枚举每个位置,然后暴力计算其他每个串以这个位置开头的最长匹配,取最小值,就是在公共子串在我们确定下来的串的这个位置开头的时候所能得到的最长公共子串.不难发现把这个问题转化成后缀的形式也是一样的.同时发现可能在枚举多个位置的时候答案甚至最后构造出来的串都是

BZOJ 2946 Poi2000 公共串 后缀自动机

题目大意:求n个串的最长公共子串 太久没写SAM了真是-- 将第一个串建成后缀自动机,用其它的串进去匹配 每个节点记录每个串在上面匹配的最大长度 那么这个节点对答案的贡献就是所有最大长度的最小值 对所有贡献取最大就行了= = 这最大最小看着真是别扭 #include <cstdio> #include <cstring> #include <iostream> #include <algorithm> #define M 10100 using namesp

hdu 4691 最长公共前缀 后缀数组 +lcp+rmq

http://acm.hdu.edu.cn/showproblem.php?pid=4691 去年暑假多校赛的题,当时还不会后缀数组 现在会了,其实自己组合后缀数组跟rmq还是对的,但是题意理解有问题,于是折腾了很久,,,, 此处简单解释下题目样例吧,希望对读者有帮助  以最后一组数据为例 myxophytamyxopodnabnabbednabbingnabit 6 0 9 9 16 16 19 19 25 25 32 32 37 前两行不解释,题目叙述很清楚 从第三行,0 9 指的是第一个字

[BZOJ2946] [Poi2000]公共串解题报告|后缀数组

给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 单词个数<=5,每个单词长度<=2000 尽管最近在学的是SAM...但是看到这个题还是忍不住想写SA... (其实是不知道应该怎么用SAM做... 对于后缀数组而言,多个字符串的公共子串与两个处理起来并没有什么区别 只要在中间加一些没有用的字符,将多个字符串拼成一个字符串 然后二分答案,对于一个长度L,在一组除了开头其他height都>=L的区间中如果每个字符串的位置都出现过就可以 应该是第二次这么解决一道公共串的题了.. 然

[Poi2000]公共串

1 #include <iostream> 2 #include <cstdio> 3 #include <cmath> 4 #include <algorithm> 5 #include <cstring> 6 #define maxn 4005 7 #define maxm 2005 8 using namespace std; 9 10 int n,m,tot,last,root,len,smin[maxn],sum[maxn],tmp[m

bzoj2946 [Poi2000]公共串(SA,SAM)

Description 给出几个由小写字母构成的单词,求它们最长的公共子串的长度. 任务: l        读入单词 l        计算最长公共子串的长度 l        输出结果 Input 文件的第一行是整数 n,1<=n<=5,表示单词的数量.接下来n行每行一个单词,只由小写字母组成,单词的长度至少为1,最大为2000. Output 仅一行,一个整数,最长公共子串的长度. Sample Input 3abcbbcaacbc Sample Output 2 [思路] 多串求LCS

[BZOJ2946][Poi2000]公共串解题报告|后缀自动机

鉴于SAM要简洁一些...于是又写了一遍这题... 不过很好呢又学到了一些新的东西... 这里是用SA做这道题的方法 首先还是和两个字符串的一样,为第一个字符串建SAM 然后每一个字符串再在这个SAM上跑匹配 然而我们最后要的答案是什么呢? 是某个在所有字符串中匹配长度最小值最大的状态子串 然后对于每一个字符串 我们可以记录它在每一个状态子串上的最大匹配长度 最后需要一个非常关键的转移 就是用当前节点的值更新fail指针指向的节点 比如这种情况 如果一次匹配到左边的三个节点,一次匹配到右边的两个

POJ 2774 求两个串的最长公共前缀 | 后缀数组

#include<cstdio> #include<algorithm> #include<cstring> #define N 200005 using namespace std; int buf1[N],buf2[N],sa[N],rnk[N],buc[N],n,height[N],ans,belong[N]; char s[N]; void suffix_sort() { int *x=buf1,*y=buf2,m=1000; for (int i=0;i<