uva 1449 - Dominating Patterns(AC自动机)

题目练级:uva 1449 - Dominating Patterns

题目大意:有一个由小写字母组成的字符串集和一个文本T,要求找出那些字符串在文本中出现的次数最多。

解题思路:将字符串集建立AC自动机,然后传入T进行匹配,对每个匹配上的字符串多应次数加1,最后找出最大值。出现次数与最大值相同的字符串输出。注意字符集中出现相同字符的情况。

#include <cstdio>
#include <cstring>
#include <queue>
#include <string>
#include <map>
#include <algorithm>

using namespace std;

const int maxn = 155;
const int maxl = 100;
const int maxt = 1e6+5;
const int sigma_size = 26;
const int noden = maxn * maxl;

char str[maxt], word[maxn][maxl];
map<string, int> ms;
int N, c[maxn];
int sz, ac[noden][sigma_size], val[noden];
int fail[noden], last[noden];

void insert (int x, char* s) {
    int u = 0, n = strlen(s);

    for (int i = 0; i < n; i++) {
        int v = s[i] - ‘a‘;
        if (ac[u][v] == 0) {
            memset(ac[sz], 0, sizeof(ac[sz]));
            val[sz] = 0;
            ac[u][v] = sz++;
        }
        u = ac[u][v];
    }
    val[u] = x;
}

void get_fail () {
    queue<int> que;
    fail[0] = 0;

    for (int i = 0; i < sigma_size; i++) {
        int u = ac[0][i];
        if (u) {
            fail[u] = last[u] = 0;
            que.push(u);
        }
    }

    while (!que.empty()) {
        int r = que.front();
        que.pop();

        for (int i = 0; i < sigma_size; i++) {
            int u = ac[r][i];

            if (u == 0) {
                ac[r][i] = ac[fail[r]][i];
                continue;
            }

            que.push(u);
            int v = fail[r];
            while (v && !ac[v][i])
                v = fail[v];

            fail[u] = ac[v][i];
            last[u] = val[fail[u]] ? fail[u] : last[fail[u]];
        }
    }
}

void count (int x) {
    if (x) {
        c[val[x]]++;
        count(last[x]);
    }
}

void find (char* T) {
    int u = 0;
    int n = strlen(T);

    for (int i = 0; i < n; i++) {
        int v = T[i] - ‘a‘;
        /*
        while (u && !ac[u][v])
            u = fail[u];
            */
        u = ac[u][v];
        if (val[u])
            count(u);
        else
            count(last[u]);
    }
}

void init () {
    sz = 1;
    ms.clear();
    memset(ac[0], 0, sizeof(ac[0]));

    for (int i = 1; i <= N; i++) {
        scanf("%s", word[i]);
        insert(i, word[i]);
        ms[string(word[i])] = i;
    }

    memset(c, 0, sizeof(c));
    get_fail();
}

int main () {
    while (scanf("%d", &N) == 1 && N) {
        init();
        scanf("%s", str);
        find(str);

        int ans = -1;
        for (int i = 1; i <= N; i++)
            ans = max(ans, c[i]);
        printf("%d\n", ans);
        for (int i = 1; i <= N; i++) {
            if (c[ms[string(word[i])]] == ans)
                printf("%s\n", word[i]);
        }
    }
    return 0;
}
时间: 2024-10-17 08:16:15

uva 1449 - Dominating Patterns(AC自动机)的相关文章

UVa 1449 Dominating Patterns

方法:AC自动机 题意比较明显,用ac 自动机.陷阱是可能会出现重复的string. code: 1 #include <cstdio> 2 #include <cstring> 3 #include <algorithm> 4 #include <iostream> 5 #include <string> 6 #include <vector> 7 #include <stack> 8 #include <bits

UVALive 4670 Dominating Patterns --AC自动机第一题

题意:多个模板串,一个文本串,求出那些模板串在文本串中出现次数最多. 解法:AC自动机入门模板题. 代码: #include <iostream> #include <cstdio> #include <cstring> #include <cstdlib> #include <cmath> #include <algorithm> #include <string> #include <vector> #in

LA 4670 Dominating Patterns (AC自动机)

题意:给定一个一篇文章,然后下面有一些单词,问这些单词在这文章中出现过几次. 析:这是一个AC自动机的裸板,最后在匹配完之后再统计数目就好. 代码如下: #pragma comment(linker, "/STACK:1024000000,1024000000") #include <cstdio> #include <string> #include <cstdlib> #include <cmath> #include <ios

LA4670 Dominating Patterns AC自动机模板

Dominating Patterns 每次看着别人的代码改成自己的模板都很头大...空间少了个0卡了好久 裸题,用比map + string更高效的vector代替蓝书中的处理方法 1 #include <iostream> 2 #include <cstdio> 3 #include <cstring> 4 #include <cstdlib> 5 #include <algorithm> 6 #include <queue> 7

UVALive - 4670 Dominating Patterns AC 自动机

input n 1<=n<=150 word1 word2 ... wordn 1<=len(wirdi)<=70 s 1<=len(s)<=1000000 output 最多出现次数 出现最多的串,按输入顺序输出,可能出现相同串,也要输出 做法:用一个end数组记下每个串结尾的字符的下标,对应val为1,每次找到就将val++,然后找到最大的val,输出最大val对应的字符串 1 #include <cstdio> 2 #include <queue

uva 1076 - Password Suspects(AC自动机+记忆化搜索)

题目链接:uva 1076 - Password Suspects 题目大意:有一个长度为n的密码,存在m个子串,问说有多少种字符串满足,如果满足个数不大于42,按照字典序输出. 解题思路:根据子串构建AC自动机,然后记忆化搜索,dp[i][u][s]表示第i个字符,在u节点,匹配s个子串. #include <cstdio> #include <cstring> #include <queue> #include <string> #include <

uva 11019 - Matrix Matcher(AC自动机)

题目链接:uva 11019 - Matrix Matcher 题目大意:给出一个n?m的字符矩阵T,要求找出给定r?c的字符矩阵P在T中出现的次数. 解题思路:对P矩阵中的每一行做一个字符串,形成一个字符串集合.构建AC自动机,然后对T矩阵中的每一行进行一次查找,对应出现在该字符串中的子串对应位置+1,如果有一个位置上r次匹配,那么就存在一个匹配矩阵. #include <cstdio> #include <cstring> #include <queue> #inc

Uva 11468 改良版AC自动机

改良版AC自动机 UVa 11468 题意:给一些字符和各自出现的概率,在其中随机选择L次,形成长度为L的字符串S,给定K个模板串,求S不包含任意一个串的概率. 首先介绍改良版的AC自动机: 传统的AC自动机,是当一个字符失配时,根据失配函数转移到指定地方,而这个失配函数,是通过一个宽搜的过程形成的,这时在匹配串的时候,就当匹配失败时,顺着失配指针走,直到可以匹配.然后匹配到单词结点,或者后缀链接是一个单词结点,这些前面的结点也是匹配单词.这就是传统的AC自动机. 现在将这个AC自动机改版优化:

UVA 1076 - Password Suspects(AC自动机+DP)

UVA 1076 - Password Suspects 题目链接 题意:一个密码,给定m个已知子串,求这个密码最多有几种表示方式,如果小于42种,就输出这些密码 思路:先利用已有子串构造AC自动机,需要改造一下的地方是每个叶子结点为(1<<i),然后构造next数组,在状态图上进行dp,dp[i][j][k]表示在结点i,长度j,已有子串集合为k的种数,进行状态转移即可,最后判断一下答案是否不大于42,如果是再根据之前求出的dp状态去进行输出即可 代码: #include <cstdi