HDU 2222:Keywords Search(AC自动机模板)

http://acm.hdu.edu.cn/showproblem.php?pid=2222

KMP是单模式串匹配的算法,而AC自动机是用于多模式串匹配的算法。主要由Trie和KMP的思想构成。

题意:输入N个模式串,再给出一个文本串,求文本串里出现的模式串数目。

  1 #include <cstdio>
  2 #include <cstring>
  3 #include <cmath>
  4 #include <cstdlib>
  5 #include <algorithm>
  6 #include <string>
  7 #include <iostream>
  8 #include <stack>
  9 #include <map>
 10 #include <queue>
 11 using namespace std;
 12 #define N 500001
 13 /*
 14 一个模式串的某个字符匹配失败的时候,就跳到它的失败指针上继续匹配,重复上述操作,直到这个字符匹配成功,所以失败指针一定满足一个性质,它指向的一定是某个串的前缀,并且这个前缀是当前结点所在前缀的后缀,而且一定是最长后缀。
 15 */
 16 struct Ac_DFA
 17 {
 18     int next[N][26]; //一开始这里用了char结果MLE
 19     int val[N], size, root, fail[N];
 20
 21     int creat() { //构造新节点
 22         for(int i = 0; i < 26; i++) {
 23             next[size][i] = -1;
 24         }
 25         val[size] = 0;
 26         return size++;
 27     }
 28
 29     void init() {
 30         size = 0;
 31         root = creat();
 32     }
 33
 34     void insert(char s[]) { //插入模式串
 35         int len = strlen(s);
 36         int now = root;
 37         for(int i = 0; i < len; i++) {
 38             int c = s[i] - ‘a‘;
 39             if(next[now][c] == -1) {
 40                 next[now][c] = creat();
 41             }
 42             now = next[now][c];
 43         }
 44         val[now]++;
 45     }
 46
 47     void build() { //构造fail函数
 48         queue<int> que;
 49         while(!que.empty()) que.pop();
 50         for(int i = 0; i < 26; i++) { //初始化
 51             if(next[root][i] == -1) { //如果没有边就补上去
 52                 next[root][i] = root;
 53             } else {
 54                 fail[next[root][i]] = root; //有边的话第一个结点指向root
 55                 que.push(next[root][i]);
 56             }
 57         }
 58         while(!que.empty()) {
 59             int now = que.front(); que.pop();
 60             for(int i = 0; i < 26; i++) {
 61                 if(next[now][i] == -1) {
 62                     next[now][i] = next[fail[now]][i]; //如果没有边构造一条边出来
 63                     // 构造的边是fail指针指向的节点的出边
 64                 } else {
 65                     fail[next[now][i]] = next[fail[now]][i]; //有边fail就指向与目前的相同结点(以目前匹配的串的最长后缀为前缀)的一条边
 66                     que.push(next[now][i]);
 67                 }
 68             }
 69         }
 70     }
 71
 72     int query(char s[]) {
 73         int len = strlen(s);
 74         int ans = 0;
 75         int now = root;
 76         for(int i = 0; i < len; i++) {
 77             now = next[now][s[i] - ‘a‘];
 78             int tmp = now;
 79             while(tmp != root) {
 80                 ans += val[tmp];
 81                 val[tmp] = 0;
 82                 tmp = fail[tmp]; // KMP思想:当前匹配失败,沿着失配边走看有没有能够匹配的串
 83             }
 84         }
 85         return ans;
 86     }
 87 };
 88
 89 char s[1000001];
 90 Ac_DFA ac;
 91
 92 int main()
 93 {
 94     int t;
 95     scanf("%d", &t);
 96     while(t--) {
 97         int n;
 98         scanf("%d", &n);
 99         ac.init();
100         for(int i = 0; i < n; i++) {
101             scanf("%s", s);
102             ac.insert(s);
103         }
104         ac.build();
105         scanf("%s", s);
106         int ans = ac.query(s);
107         printf("%d\n", ans);
108     }
109     return 0;
110 }
时间: 2024-10-12 17:08:03

HDU 2222:Keywords Search(AC自动机模板)的相关文章

HDU 2222 Keywords Search(AC自动机模板题)

原题大意:原题链接 先给定T个单词,然后给定一个字符串,查询该字符串中包含多少个给定的单词 解题思路:AC自动机模板题 参考链接:哔哩哔哩算法讲堂 WA版本 注意:因为输入的单词可能有重复,那么Insert()函数中p->id=id;语句中p->id会被覆盖,在Query()函数中会一次性全部被清零,导致不能查询重复单词,以至于结果res错误. #include<queue> #include<cstdio> #include<cstring> using

HDU 2222 Keywords Search (AC自动机模板题)

Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 67950    Accepted Submission(s): 22882 Problem Description In the modern time, Search engine came into the life of everybody lik

HDU 2222 Keywords Search AC自动机模板

题目链接: hdu2222 代码: #include<iostream> #include<cstdio> #include<string> #include<cstring> #include<queue> using namespace std; struct node { int sum; node* fail; node* next[26]; node() { sum=0; fail=NULL; for(int i=0; i<26;

HDU 2222 Keyword Search AC自动机模板

#include <algorithm> #include <iostream> #include <cstring> #include <cstdlib> #include <cstdio> #include <queue> #include <cmath> #include <stack> #include <map> #include <ctime> #include <io

HDU 2222 Keywords Search AC自动机入门题

单词统计的题目,给出一些单词,统计有多少单词在一个文本中出现,最经典的入门题了. AC自动机的基础: 1 Trie, 以这个数据结构为基础的,不过增加一个fail指针和构造fail的函数 2 KMP,不是直接运用KMP,而是需要KMP的思想,KMP思想都没有的话,理解这个算法会更加吃力的. 注意本题的单词会有重复出现的,一个单词只能统计一次. 搜索了一下网上的题解,发现好多代码都是一大抄的啊,⊙﹏⊙b汗. 本博客的乃是原创代码,代码风格也是差不多固定的,转载请注明出处:http://blog.c

HDU 2222 Keywords Search (AC自动机入门 模板)

AC自动机入门 Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.学习AC自动机之前得先有Trie树和KMP模式匹配算法的基础. AC自动机算法分为3步:1.构造一棵tire树  2.构造失败指针  3.进行模式匹配 AC自动机的优化:Trie图 Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Other

hdu 2222 Keywords Search(ac自动机入门题)

1 /************************************************************ 2 题目: Keywords Search(hdu 2222) 3 链接: http://acm.hdu.edu.cn/showproblem.php?pid=2222 4 算法: ac自动机 5 算法思想: 多个字符串匹配,也就是相当于多个kmp 6 ***********************************************************

hdu 2222 Keywords Search ac自动机入门

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串.其中模式串可以重复.问有多少文本串在模式串中出现过.(对于相同的模式串次数仍然累加) 思路:ac自动机裸题: KMP是先将文本串进行匹配得到失配边f[];但是并不适用于文本串较长,模式串较多的情况.因为每次查询的时间复杂度为O(n+m).n,m分别为文本串和模式串的长度: ac自动机就是建立在Trie上,

HDU 2222 Keywords Search AC自动机

Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 67122    Accepted Submission(s): 22584 Problem Description In the modern time, Search engine came into the life of everybody lik

Match:Keywords Search(AC自动机模板)(HDU 2222)

多模匹配 题目大意:给定很多个字串A,B,C,D,E....,然后再给你目标串str字串,看目标串中出现多少个给定的字串. 经典AC自动机模板题,不多说. 1 #include <iostream> 2 #include <algorithm> 3 #include <functional> 4 #include <string.h> 5 #define MAX 26 6 7 using namespace std; 8 9 struct node 10 {