Codeforces Round #244 (Div. 2)D (后缀自己主动机)

Codeforces Round #244 (Div. 2)D (后缀自己主动机)

(标号为0的节点一定是null节点,不管怎样都不能拿来用,切记切记,以后不能再错了)

这题用后缀自己主动机的话,对后缀自己主动机的非常多性质有足够深刻的理解。

没想过后缀数组怎么做。由于不高兴敲。。。

题意:给出两个长度均不超过5000的字符串s1,s2,求这两个串中,都仅仅出现一次的最短公共子串。

解题思路:求的是公共子串,然后对出现的次数又有限制,第一想法就是后缀自己主动机啊,后缀自己主动机处理子串出现次数再合适只是了。做法是这种。先建立s1的sam。用拓扑dp,求出每一个节点的代表串出现的次数。

目的是什么呢?事实上我是想求ok[i][j]。表示s1[i] ~ s1[j]的这个子串是否仅仅出现了一次。

如今我们求出了代表串的出现次数了。怎么求这个ok[i][j]呢?拿s1在建立好的自己主动机上匹配,当前匹配到了s1[i],记录temp表示当前匹配的最长长度。now表示当前匹配在哪个节点。这里有一个跟AC自己主动机非常相似的性质。匹配到了now,则一定能匹配fa[now]。

那么就顺着now往上走。一直找到第一个出现次数大于1的节点p,那么以i为结尾。长度为val[p]+1到temp的子串在s1里面肯定都仅仅出现一次了。把这个记录到ok数组里。
   第二步是对s2处理了。还是一样的过程,建立sam。求出每一个点的代表串出现的次数,即cnt[]数组。   第三步就要拿s1在s2的sam上进行匹配了,匹配过程类似于前面处理s1的ok数组,找出当前匹配的最长长度temp。匹配到的节点now,顺着now往上。找到第一个cnt大于1的节点p。在s2里面,以当前匹配上的子串的结尾为结尾的长度为val[p] + 1到temp的子,串必定仅仅在s2里出现过一次。

然后就枚举j,从val[p] + 1到temp,假设在s1里面。以i为结尾。长度为j的子串仅仅出现1次(即ok[i-j+1][i]
== 1)。那么这个j就有可能成为答案,用其更新ans就可以。

代码:

#include<stdio.h>
#include<string.h>
#include<algorithm>
using namespace std ;

const int maxn = 5001 ;
bool ok[maxn][maxn] ;
int ans = 111111 ;

struct SAM  {
    int fa[maxn<<1] , val[maxn<<1] , c[26][maxn<<1] ;
    int cnt[maxn<<1] ; int tot , last ;
    int ws[maxn<<1] , wv[maxn<<1] ;

    inline int new_node ( int _val ) {
        val[++tot] = _val ;
        for ( int i = 0 ; i < 26 ; i ++ ) c[i][tot] = 0 ;
        cnt[tot] = fa[tot] = 0 ;
        return tot ;
    }

    void add ( int k ) {
        int p = last , i ;
        int np = new_node ( val[p] + 1 ) ;
        while ( p && !c[k][p] ) c[k][p] = np , p = fa[p] ;
        if ( !p ) fa[np] = 1 ;
        else {
            int q = c[k][p] ;
            if ( val[q] == val[p] + 1 ) fa[np] = q ;
            else {
                int nq = new_node ( val[p] + 1 ) ;
                for ( i = 0 ; i < 26 ; i ++ )
                    c[i][nq] = c[i][q] ;
                fa[nq] = fa[q] ;
                fa[q] = fa[np] = nq ;
                while ( p && c[k][p] == q ) c[k][p] = nq , p = fa[p] ;
            }
        }
        last = np ;
    }

    void init () {
        tot = 0 ;
        last = new_node ( 0 ) ;
    }

    void SORT () {
        for ( int i = 0 ; i < maxn ; i ++ ) wv[i] = 0 ;
        for ( int i = 1 ; i <= tot ; i ++ ) wv[val[i]] ++ ;
        for ( int i = 1 ; i < maxn ; i ++ ) wv[i] += wv[i-1] ;
        for ( int i = 1 ; i <= tot ; i ++ ) ws[wv[val[i]]--] = i ;
    }

    void get_cnt ( char *s , int n ) {
        SORT () ;
        int now = 1 , i ;
        memset ( cnt , 0 , sizeof ( cnt ) ) ;
        for ( i = 1 ; i <= n ; i ++ ) {
            int k = s[i] - ‘a‘ ;
            now = c[k][now] ;
            cnt[now] ++ ;
        }
        for ( i = tot ; i >= 1 ; i -- ) {
            now = ws[i] ;
            cnt[fa[now]] += cnt[now] ;
        }
    }

    void gao ( char *s , int n ) {
        get_cnt ( s , n ) ;
        int now = 1 , i , j ;
        for ( i = 1 ; i <= n ; i ++ ) {
            int k = s[i] - ‘a‘ ;
            now = c[k][now] ;
            int p = now ;
            while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
            for ( j = 1 ; j <= i - val[p] ; j ++ )
                ok[j][i] = 1 ;
        }
    }

    void work ( char *s , int n ) {
        int temp = 0 , now = 1 , i , j ;
        for ( i = 1 ; i <= n ; i ++ ) {
            int k = s[i] - ‘a‘ ;
            if ( c[k][now] ) {
                temp ++ ; now = c[k][now] ;
                int p = now ;
                while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
                for ( j = val[p] + 1 ; j <= temp ; j ++ )
                    if ( ok[i-j+1][i] ) {
                        ans = min ( ans , j ) ;
                        break ;
                    }
            }
            else {
                while ( now && !c[k][now] ) now = fa[now] ;
                if ( !now ) now = 1 , temp = 0 ;
                else {
                    temp = val[now] + 1 ;
                    now = c[k][now] ;
                    int p = now ;
                    while ( fa[p] && cnt[p] == 1 ) p = fa[p] ;
                    for ( j = val[p] + 1 ; j <= temp ; j ++ )
                        if ( ok[i-j+1][i] ) {
                            ans = min ( ans , j ) ;
                            break ;
                        }
                }
            }
        }
    }

} ac ;
char s1[maxn] , s2[maxn] ;

int main () {
    scanf ( "%s" , s1 + 1 ) ;
    ac.init () ;
    int n = strlen ( s1 + 1 ) , i , j ;
    for ( i = 1 ; i <= n ; i ++ )
        ac.add ( s1[i] - ‘a‘ ) ;
    ac.gao ( s1 , n ) ;
    scanf ( "%s" , s2 + 1 ) ;
    ac.init () ;
    int m= strlen ( s2 + 1 ) ;
    for ( i = 1 ; i <= m ; i ++ )
        ac.add ( s2[i] - ‘a‘ ) ;
    ac.get_cnt ( s2 , m ) ;
    ac.work ( s1 , n ) ;
    if ( ans == 111111 ) puts ( "-1" ) ;
    else printf ( "%d\n" , ans ) ;
    return 0 ;
}
时间: 2024-11-06 09:58:38

Codeforces Round #244 (Div. 2)D (后缀自己主动机)的相关文章

Codeforces Round #244 (Div. 2)D (后缀自动机)

Codeforces Round #244 (Div. 2)D (后缀自动机) (标号为0的节点一定是null节点,无论如何都不能拿来用,切记切记,以后不能再错了) 这题用后缀自动机的话,对后缀自动机的很多性质有足够深刻的理解.没想过后缀数组怎么做,因为不高兴敲.... 题意:给出两个长度均不超过5000的字符串s1,s2,求这两个串中,都只出现一次的最短公共子串. 解题思路:求的是公共子串,然后对出现的次数又有限制,第一想法就是后缀自动机啊,后缀自动机处理子串出现次数再合适不过了.做法是这样的

Codeforces Round #244 (Div. 2)

A. Police Recruits B. Prison Transfer A,B两个是水题. C. Checkposts DFS找出所有的环就行了. 每次搜索一个结点u时,给u加一个递增标号low[u],同时记录搜索u及u的子结点过程中遇到的最小标号minc,也就是当搜索u的子结点v时,minc = min(minc, low[v]).搜索完成后,如果minc < low[u],说明搜索u的子结点时又回到了u的父结点,也就是说u在一个环中,然后求出这个环的最小费用及取到最小费用的结点数. D.

Codeforces Round #244 (Div. 2)——Match &amp; Catch

题目链接 题意:给两个长度分别为n和m的序列,现在有两种操作:1.分别选择两个序列的一个非空前缀,切两个前缀的最后一位相同,删除之,得到1分(只累计),消耗e:2.直接删除两个序列,消耗值定于两个序列之前删除的元素个数之和,并且使得得到的分有效(之前没有有效分) 分析: 首先,问题其实就是转化成,进行若干次操作1,然后进行操作2 还要找到一个判别标准,来评判较优的状态(贪心) 每次的消耗值比较大,其实可以计算出最大的删除次数,这个值不是很大 状态表示: 简单的,一个状态可以表示为串A的位置.串B

Codeforces Round #244 (Div. 2)——Checkposts

题目链接 题意: 给定n个点,每个点有一个权值的有向图.现在需要选定一些点,使得这些点权值和最小,且满足:如果i能到达j且j能到达i,那么i.j可以只选一个 分析: 强联通模板题 //使用时只更新G完成构图 //scc_cnt从1开始计数 //pre[]表示点在DFS树中的先序时间戳 //lowlink[]表示当前点和后代能追溯到的最早祖先的pre值 //sccno[]表示点所在的双连通分量编号 //vector<int> G保存每个点相邻的下一个点序号 //stack<Edge>

Codeforces Round #244 (Div. 2) B. Prison Transfer

题目是选出c个连续的囚犯,而且囚犯的级别不能大于t #include <iostream> using namespace std; int main(){ int n,t,c; cin >> n >> t >> c; int a,cnt = 0, res =0;; for(int i = 0 ; i < n ; ++ i) { cin >> a; if(a > t ){ if(cnt > c-1) res+=cnt-c+1;

Codeforces Round #244 (Div. 2) A. Police Recruits

题目的意思就是找出未能及时处理的犯罪数, #include <iostream> using namespace std; int main(){ int n; cin >> n; int a,recruit = 0, crimes = 0;; for(int i = 0 ; i < n; ++ i){ cin >> a; if(a > 0) recruit+=a; else recruit?recruit-- : crimes++; } cout<&

Codeforces Round #244 (Div. 2) D. Match &amp; Catch 后缀数组

链接: http://codeforces.com/contest/427/problem/D 题意: 给你两个字符串s1,s2,找出最短的子串出现在s1和s2中有且只有一次 题解: 还是把s1和s2连起来,求lcp.首先要知道得是,最短长度一定是sa数组中一定是相连的, 这样就只需要遍历一遍lcp数组,更新ans就可以了 ans = min(ans, max(lcp[i - 1], lcp[i + 1]) + 1) 代码: 31 int n, k; 32 int Rank[MAXN], tmp

Codeforces Round #244 (Div. 2) B. Prison Transfer 线段树rmq

B. Prison Transfer Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/problemset/problem/427/B Description The prison of your city has n prisoners. As the prison can't accommodate all of them, the city mayor has decided to transfer c

Codeforces Round #244 (Div. 2)B. Prison Transfer(想法题)

传送门 Description The prison of your city has n prisoners. As the prison can't accommodate all of them, the city mayor has decided to transfer c of the prisoners to a prison located in another city. For this reason, he made the n prisoners to stand in