【模板】AC自动机(加强版)

题目描述

个由小写字母组成的模式串以及一个文本串。每个模式串可能会在文本串中出现多次。你需要找出哪些模式串在文本串中出现的次数最多。

输入输出格式

输入格式:

输入含多组数据。

每组数据的第一行为一个正整数,表示共有个模式串,

接下去行,每行一个长度小于等于的模式串。下一行是一个长度小于等于的文本串

输入结束标志为

输出格式:

对于每组数据,第一行输出模式串最多出现的次数,接下去若干行每行输出一个出现次数最多的模式串,按输入顺序排列。

输入输出样例

输入样例#1:

2
aba
bab
ababababac
6
beta
alpha
haha
delta
dede
tata
dedeltalphahahahototatalpha
0

输出样例#1:

4
aba
2
alpha
haha

个人认为没有什么特别大的变化,记录一下,然后简单运用一下,就ok了,纯裸题,不过用c++自带的queue貌似有些慢,应该可以优化一下。
 1 #include<cstdio>
 2 #include<algorithm>
 3 #include<cmath>
 4 #include<iostream>
 5 #include<cstring>
 6 #include<queue>
 7 using namespace std;
 8
 9 int n,cnt=1,fzy[157];
10 char s[157][77];
11 struct Node
12 {
13     int c[26],suf,flag,mark;
14     void init()
15     {
16         suf=flag=mark=0;
17         memset(c,0,sizeof(c));
18     }
19 }tree[1000007];
20
21 void init()
22 {
23     memset(fzy,0,sizeof(fzy));
24     for (int i=0;i<=cnt;i++)
25         tree[i].init();
26     cnt=1;
27 }
28 void Ins(int num)
29 {
30     int head=1,l=strlen(s[num]);
31     for (int i=0;i<l;i++)
32     {
33         int now=s[num][i]-‘a‘;
34         if (!tree[head].c[now]) tree[head].c[now]=++cnt;
35         head=tree[head].c[now];
36     }
37     tree[head].flag++,tree[head].mark=num;
38 }
39 void Make_AC()
40 {
41     for (int i=0;i<26;i++) tree[0].c[i]=1;
42     int head=0,tail=1;
43     queue<int>q;
44     while (!q.empty()) q.pop();
45     tree[1].suf=0;
46     q.push(1);
47     while (!q.empty())
48     {
49         int u=q.front();
50         q.pop();
51         for (int i=0;i<26;i++)
52             if (tree[u].c[i])
53             {
54                 tree[tree[u].c[i]].suf=tree[tree[u].suf].c[i];
55                 q.push(tree[u].c[i]);
56             }
57             else tree[u].c[i]=tree[tree[u].suf].c[i];
58     }
59 }
60 void Solve()
61 {
62     char s1[1000007];
63     scanf("%s",s1);
64     int head=1,len=strlen(s1);
65     for (int i=0;i<len;i++)
66     {
67         int now=s1[i]-‘a‘;
68         head=tree[head].c[now];
69         for (int j=head;j&&tree[j].flag!=-1;j=tree[j].suf)
70             fzy[tree[j].mark]+=tree[j].flag;
71     }
72     int x=fzy[1];
73     for (int i=2;i<=n;i++)
74         if (x<fzy[i]) x=fzy[i];
75     printf("%d\n",x);
76     for (int i=1;i<=n;i++)
77         if (x==fzy[i]) printf("%s\n",s[i]);
78 }
79 int main()
80 {
81     while (scanf("%d",&n)&&n)
82     {
83         init();
84         for (int i=1;i<=n;i++)
85             {scanf("%s",s[i]);Ins(i);}
86         Make_AC();
87         Solve();
88     }
89 }
 
时间: 2024-10-07 10:25:44

【模板】AC自动机(加强版)的相关文章

算法模板——AC自动机

实现功能——输入N,M,提供一个共计N个单词的词典,然后在最后输入的M个字符串中进行多串匹配(关于AC自动机算法,此处不再赘述,详见:Aho-Corasick 多模式匹配算法.AC自动机详解.考虑到有时候字典会相当稀疏,所以引入了chi和bro指针进行优化——其原理比较类似于邻接表,这个东西本身和next数组本质上是一致的,只是chi和bro用于遍历某一节点下的子节点,next用于查询某节点下是否有需要的子节点) 1 type 2 point=^node; 3 node=record 4 ex:

[模板]AC自动机(1)

题目描述 给定一个文本串和多个模式串,求有几个模式串出现在文本串中 #include <cstdio> #include <cstring> #include <algorithm> #define MAXN 1000005 char s[MAXN]; int N; struct queue{ int que[MAXN];int head,tail; queue():head(1),tail(0){} inline void pop(){head++;} inline

模板——AC自动机

#include<bits/stdc++.h> using namespace std; struct nob{ int fail,son[27],ed; }a[1000000]; int cnt=0; void build (string s){ int now=0; for (int i=0; i<s.length(); i++){ if (a[now].son[s[i]-'a']==0) a[now].son[s[i]-'a']=++cnt; now=a[now].son[s[i]

AC自动机例题

P3808 [模板]AC自动机(简单版) [题目描述] 给定n个模式串和1个文本串,求有多少个模式串在文本串里出现过. #include<bits/stdc++.h> using namespace std; typedef long long LL; const int INF=1e9+7; inline LL read(){ register LL x=0,f=1;register char c=getchar(); while(c<48||c>57){if(c=='-')f=

【题解】P3796【模板】AC自动机(加强版)

[题解]P3796 [模板]AC自动机(加强版) 记录当前\(cnt\)是第几个"星".记录第几个串是对应着第几个星. 这里补充一点对于\(AC\)自动机的理解.可能一直有个问题我没有想明白,就是打标记的点只有一个,然而匹配时,假若一个分支包括了另一个不同的分支该怎么办.实际上,我们可以在匹配的时候使用\(fail\)数组进行类似链式前向星的遍历,从而遍历到那个打标记的地方.那么问题来了,怎么保证链式前向星会遍历到那个打了标记的节点呢?答案就在\(gen\_fail\)的玄机里.\(g

P3796 【模板】AC自动机(加强版)

题目描述 有个由小写字母组成的模式串以及一个文本串.每个模式串可能会在文本串中出现多次.你需要找出哪些模式串在文本串中出现的次数最多. 输入输出格式 输入格式: 输入含多组数据. 每组数据的第一行为一个正整数,表示共有个模式串,. 接下去行,每行一个长度小于等于的模式串.下一行是一个长度小于等于的文本串. 输入结束标志为. 输出格式: 对于每组数据,第一行输出模式串最多出现的次数,接下去若干行每行输出一个出现次数最多的模式串,按输入顺序排列. 输入输出样例 输入样例#1: 2 aba bab a

luogu P3796【模板】AC自动机(加强版)

嘟嘟嘟 这个和某谷的AC自动机模板简单版差不多. 但还是要注意几点的: 1.这个是统计出现次数,而不是是否出现,所以在查询的时候加上这个节点的val后,不能把val标记为-1.那么也就可以说查询的时间复杂度能比简单版的稍微第一慢一点. 2.考虑k个一样的模式串:刚开始我想的是每一个节点开一个vector,记录这里是第几个模式串.但其实没有这个必要,对于相同的模式串,我们只用记录任意一个就行,反而在出现次数上要都加上.因为如果主串中存在这些相同的模式串,那么出现次数应该是出现次数 * k.输出的时

P3796 【模板】AC自动机(加强版) 题解(Aho-Corasick Automation)

题目链接 AC自动机 解题思路 AC自动机模板题. 刚学AC自动机,写一篇博客增强理解. AC自动机最关键的一点在于,\(fail\)失配指针的构造. \(fail\)指针指向的地方,是匹配出现错误后进行重新匹配的位置,这说明,从根开始到\(fail\)指针指向的地方这一块字符串,正是我们刚刚失配之前配上的那一块字符串(子串),且为最长子串.这一点和KMP算法相同. AC代码 #include<stdio.h> #include<string.h> int ac[100010][2

LG5357 「模板」AC自动机(二次加强版) AC自动机+fail树

问题描述 LG5357 题解 不是fail树的AC自动机复杂度是假的. 把AC自动机搞出来,建立Trie树,树上爆搜一遍就好了. \(\mathrm{Code}\) #include<bits/stdc++.h> using namespace std; template <typename Tp> void read(Tp &x){ x=0;char ch=1;int fh; while(ch!='-'&&(ch>'9'||ch<'0')) c

【模板】AC自动机

来自洛谷的两道AC自动机模板题: [模板]AC自动机(简单版) 题目背景 这是一道简单的AC自动机模板题. 用于检测正确性以及算法常数. 为了防止卡OJ,在保证正确的基础上只有两组数据,请不要恶意提交. 管理员提示:本题数据内有重复的单词,且重复单词应该计算多次,请各位注意 题目描述 给定n个模式串和1个文本串,求有多少个模式串在文本串里出现过. 输入输出格式 输入格式: 第一行一个n,表示模式串个数: 下面n行每行一个模式串: 下面一行一个文本串. 输出格式: 一个数表示答案 输入输出样例 输