Keywords Search (AC自动机模版题)

Problem Description

In the modern time, Search engine came into the life of everybody like Google, Baidu, etc.
Wiskey also wants to bring this feature to his image retrieval system.
Every image have a long description, when users type some keywords to find the image, the system will match the keywords with description of image and show the image which the most keywords be matched.
To simplify the problem, giving you a description of image, and some keywords, you should tell me how many keywords will be match.

Input

First line will contain one integer means how many cases will follow by.
Each case will contain two integers N means the number of keywords and N keywords follow. (N <= 10000)
Each keyword will only contains characters ‘a‘-‘z‘, and the length will be not longer than 50.
The last line is the description, and the length will be not longer than 1000000.

Output

Print how many keywords are contained in the description.

Sample Input

1
5
she
he
say
shr
her
yasherhs

Sample Output

3

Author

Wiskey

Recommend

lcy   |   We have carefully selected several similar problems for you:  3065 2243 2825 3341 3247

 1 #include <stdio.h>
 2 #include <iostream>
 3 #include <algorithm>
 4 #include <string.h>
 5 #include <stdlib.h>
 6 #include <math.h>
 7 #include <queue>
 8 #include <set>
 9
10 #define INF 0x3f3f3f3f
11 #define pii pair<int,int>
12 using namespace std;
13 const int maxn = 1e6+10;
14
15 char buf[maxn];
16 struct ac_automation{
17     int next[maxn][26],fail[maxn],end[maxn];
18     int root,L;
19     int newnode(){
20         for (int i=0;i<26;i++)
21         {
22             next[L][i] = -1;
23         }
24         end[L++] = 0;
25         return L-1;
26     }
27     void init(){
28         L = 0;
29         root = newnode();
30     }
31     void insert(char buf[]){
32         int len = strlen(buf);
33         int now = root;
34         for (int i=0;i<len;i++){
35             if (next[now][buf[i]-‘a‘] == -1)
36                 next[now][buf[i]-‘a‘] = newnode();
37             now = next[now][buf[i]-‘a‘];
38         }
39         end[now]++;
40     }
41     void build(){
42         queue<int > Q;
43         fail[root] = root;
44         for (int i=0;i<26;i++)
45         {
46             if (next[root][i] == -1)
47                 next[root][i] = root;
48             else{
49                 fail[next[root][i]] = root;
50                 Q.push(next[root][i]);
51             }
52         }
53         while (!Q.empty()){
54             int now = Q.front();
55             Q.pop();
56             for (int i=0;i<26;i++){
57                 if (next[now][i] == -1)
58                     next[now][i] = next[fail[now]][i];
59                 else{
60                     fail[next[now][i]] = next[fail[now]][i];
61                     Q.push(next[now][i]);
62                 }
63             }
64         }
65     }
66     int querry(char buf[]){
67         int len = strlen(buf);
68         int now = root;
69         int res = 0;
70         for (int i=0;i<len;i++){
71             now = next[now][buf[i]-‘a‘];
72             int temp = now;
73             while (temp!=root){
74                 res += end[temp];
75                 end[temp] = 0;
76                 temp = fail[temp];
77             }
78         }
79         return res;
80     }
81 }ac;
82
83 int main(){
84     int T;
85     scanf("%d",&T);
86     while (T--){
87         int n;
88         scanf("%d",&n);
89         ac.init();
90         for (int i=0;i<n;i++){
91             scanf("%s",buf);
92             ac.insert(buf);
93         }
94         ac.build();
95         scanf("%s",buf);
96         printf("%d\n",ac.querry(buf));
97     }
98     return 0;
99 }

原文地址:https://www.cnblogs.com/-Ackerman/p/11324266.html

时间: 2024-10-10 17:51:52

Keywords Search (AC自动机模版题)的相关文章

HDU 2222 Keywords Search AC自动机入门题

单词统计的题目,给出一些单词,统计有多少单词在一个文本中出现,最经典的入门题了. AC自动机的基础: 1 Trie, 以这个数据结构为基础的,不过增加一个fail指针和构造fail的函数 2 KMP,不是直接运用KMP,而是需要KMP的思想,KMP思想都没有的话,理解这个算法会更加吃力的. 注意本题的单词会有重复出现的,一个单词只能统计一次. 搜索了一下网上的题解,发现好多代码都是一大抄的啊,⊙﹏⊙b汗. 本博客的乃是原创代码,代码风格也是差不多固定的,转载请注明出处:http://blog.c

HDU 2222 Keywords Search(AC自动机模板题)

原题大意:原题链接 先给定T个单词,然后给定一个字符串,查询该字符串中包含多少个给定的单词 解题思路:AC自动机模板题 参考链接:哔哩哔哩算法讲堂 WA版本 注意:因为输入的单词可能有重复,那么Insert()函数中p->id=id;语句中p->id会被覆盖,在Query()函数中会一次性全部被清零,导致不能查询重复单词,以至于结果res错误. #include<queue> #include<cstdio> #include<cstring> using

HDU 2222 Keywords Search (AC自动机模板题)

Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 67950    Accepted Submission(s): 22882 Problem Description In the modern time, Search engine came into the life of everybody lik

hdu 2222 Keywords Search(ac自动机入门题)

1 /************************************************************ 2 题目: Keywords Search(hdu 2222) 3 链接: http://acm.hdu.edu.cn/showproblem.php?pid=2222 4 算法: ac自动机 5 算法思想: 多个字符串匹配,也就是相当于多个kmp 6 ***********************************************************

hdu2222 Keywords Search &amp; AC自动机学习小结

传送门:http://http://acm.hdu.edu.cn/showproblem.php?pid=2222 思路:AC自动机入门题,直接上AC自动机即可. 对于构建AC自动机,我们要做的只有三件事: 1)构建字典树 2)构建失败指针 3)构建trie图(这道题好像不做这一步也能A...但是这一步不做是会被卡成O(n^2)的...) 1)第一步还是比较好理解的 根是虚根,边代表字母,那么根到终止节点的路径就是一个字符串,这样对于前缀相同的字符串我们就可以省下存公共前缀的空间. 加入一个模式

HDU 2896 病毒侵袭(AC自动机模版题)

AC自动模版题,中文题目就不叙述题意了啊. AC自动主要是构造出字典树之后找到fail指针的跳转,类似于KMP里面的next数组的跳转啊,注意这里是多模式跳转.意思就是这个串跳到下一个串的什么位置啊. 先帖一下,做多了再一起总结吧. 病毒侵袭 Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 11347    Accepted Submi

Match:Keywords Search(AC自动机模板)(HDU 2222)

多模匹配 题目大意:给定很多个字串A,B,C,D,E....,然后再给你目标串str字串,看目标串中出现多少个给定的字串. 经典AC自动机模板题,不多说. 1 #include <iostream> 2 #include <algorithm> 3 #include <functional> 4 #include <string.h> 5 #define MAX 26 6 7 using namespace std; 8 9 struct node 10 {

hdu 2222 Keywords Search ac自动机入门

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串.其中模式串可以重复.问有多少文本串在模式串中出现过.(对于相同的模式串次数仍然累加) 思路:ac自动机裸题: KMP是先将文本串进行匹配得到失配边f[];但是并不适用于文本串较长,模式串较多的情况.因为每次查询的时间复杂度为O(n+m).n,m分别为文本串和模式串的长度: ac自动机就是建立在Trie上,

hdu2222 Keywords Search ac自动机

地址:http://acm.split.hdu.edu.cn/showproblem.php?pid=2222 题目: Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 56558    Accepted Submission(s): 18493 Problem Description In the mo

HDU 2222 Keywords Search (AC自动机入门 模板)

AC自动机入门 Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.学习AC自动机之前得先有Trie树和KMP模式匹配算法的基础. AC自动机算法分为3步:1.构造一棵tire树  2.构造失败指针  3.进行模式匹配 AC自动机的优化:Trie图 Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Other