HDU 2222——Keywords Search(AC自动机)

Keywords Search

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)

Total Submission(s): 34020    Accepted Submission(s): 11009

Problem Description

In the modern time, Search engine came into the life of everybody like Google, Baidu, etc.

Wiskey also wants to bring this feature to his image retrieval system.

Every image have a long description, when users type some keywords to find the image, the system will match the keywords with description of image and show the image which the most keywords be matched.

To simplify the problem, giving you a description of image, and some keywords, you should tell me how many keywords will be match.

Input

First line will contain one integer means how many cases will follow by.

Each case will contain two integers N means the number of keywords and N keywords follow. (N <= 10000)

Each keyword will only contains characters ‘a‘-‘z‘, and the length will be not longer than 50.

The last line is the description, and the length will be not longer than 1000000.

Output

Print how many keywords are contained in the description.

Sample Input

1
5
she
he
say
shr
her
yasherhs

Sample Output

3

————————————————————————————————————————————————

#include<iostream>
#include<cstring>
#include<cstdio>
#include<cstdlib>
#include<queue>
#define sigma_size 26
using namespace std;
char str[55],s[1000001];
struct node
{
    int count;
    node *next[sigma_size];
    node *fail;
};

node *root=new node;
void init(node *p)
{
    memset(p->next,0,sizeof p->next);
    p->count=0;
    p->fail=NULL;
}

void insert(char *s)
{
    int l=strlen(s);
    node *p=root,*q;
    for(int i=0;i<l;++i){
        int c=s[i]-'a';
        if(p->next[c]==NULL){
            q=new node;
            init(q);
            p->next[c]=q;
        }
        p=p->next[c];
    }
    p->count++;
}

void get_fail()
{
    node *p;
    queue<node *> q;
    q.push(root);
    while(!q.empty()){
        p=q.front();q.pop();
        for(int i=0;i<sigma_size;++i){
            if(p->next[i]==NULL) continue;
            q.push(p->next[i]);

            if(p==root){
                p->next[i]->fail=root;
            }
            else{
                node *u=p;
                while(u->fail!=NULL&&u->fail->next[i]==NULL)
                    u=u->fail;
                if(u->fail==NULL) p->next[i]->fail=root;
                else p->next[i]->fail=u->fail->next[i];
            }

        }
    }
}

int find(char *s)
{
    node *p=root,*q;
    int l=strlen(s),res=0;
    for(int i=0;i<l;++i){
        int c=s[i]-'a';
        while(p!=root&&p->next[c]==NULL) p=p->fail;
        if(p->next[c]==NULL) continue;
        p=p->next[c];
        q=p;
        while(q!=root&&q->count!=-1){
            res+=q->count;
            q->count=-1;
            q=q->fail;
        }
    }
    return res;
}

void freedom(node *p)
{
    for(int i=0;i<26;++i){
        if(p->next[i]!=NULL){
            freedom(p->next[i]);
        }
    }
    delete p;
}

int main()
{
    int T,n;
    scanf("%d",&T) ;
    while(T--){
        init(root) ;
        scanf("%d",&n) ;
        getchar();
        while(n--){
            gets(str) ;
            insert(str) ;
        }
        get_fail() ;
        gets(s) ;
        printf("%d\n",find(s) ) ;
        for(int i = 0;i < 26;i ++){//注意root不能删除

            if(root->next[i] != NULL)
                freedom(root->next[i]) ;
        }
    }
    return 0 ;
}

#include<iostream>
#include<cstring>
#include<cstdlib>
#include<queue>
#include<cstdio>
#define maxnode 500000+10
#define sigma_size 26
#define M 1000000+10
using namespace std;
char str[M];
struct tree
{
    int f[maxnode];
    int ch[maxnode][sigma_size];
    int val[maxnode];
    int sz;
    void reset(){memset(ch[0],0,sizeof ch[0]);memset(f,0,sizeof f);memset(val,0,sizeof val);sz=1;}
    int idx(char c){return c-'a';}

    void insert(char *s)
    {
        int l=strlen(s);
        int u=0;
        for(int i=0;i<l;++i){
            int c=idx(s[i]);
            if(!ch[u][c]){
                memset(ch[sz],0,sizeof ch[sz]);
                ch[u][c]=sz++;
            }
            u=ch[u][c];
        }
        val[u]++;
    }

    void get_fail()
    {
        queue<int> q;
        for(int c=0;c<sigma_size;++c){
            int u=ch[0][c];
            if(u){f[u]=0;q.push(u);}
        }
        while(!q.empty()){
            int r=q.front();q.pop();
            for(int i=0;i<sigma_size;++i){
                int u=ch[r][i];
                if(!u) continue;
                q.push(u);
                int v=f[r];//指向父亲的失败指针
                while(v&&!ch[v][i]) v=f[v];//父亲的失败指针的儿子不存在c,就继续沿着失败指针走
                f[u]=ch[v][i];
            }
        }
    }

    int find(char *s)
    {
        int l=strlen(s);
        int u=0,res=0;
        for(int i=0;i<l;++i){
            int c=idx(s[i]);

            while(u&&!ch[u][c]) u=f[u];
            if(!ch[u][c]) continue;//不匹配则跳过
            u=ch[u][c];//匹配,那么从该节点继续匹配
            int tmp=u;//temp指针,寻找较短的前缀
            while(tmp&&val[tmp]!=-1){

                res+=val[tmp];
                val[tmp]=-1;
                tmp=f[tmp];
            }
        }
        return res;
    }
}Trie;
int main()
{
    int T;
    cin>>T;
    while(T--){
        Trie.reset();
        int n;
        scanf("%d",&n);
        while(n--){
            scanf("%s",str);
            Trie.insert(str);
        }
        Trie.get_fail();
        scanf("%s",str);
        printf("%d\n",Trie.find(str));
    }
    return 0;
}

HDU 2222——Keywords Search(AC自动机)

时间: 2024-10-14 08:38:26

HDU 2222——Keywords Search(AC自动机)的相关文章

HDU 2222 Keywords Search AC自动机入门题

单词统计的题目,给出一些单词,统计有多少单词在一个文本中出现,最经典的入门题了. AC自动机的基础: 1 Trie, 以这个数据结构为基础的,不过增加一个fail指针和构造fail的函数 2 KMP,不是直接运用KMP,而是需要KMP的思想,KMP思想都没有的话,理解这个算法会更加吃力的. 注意本题的单词会有重复出现的,一个单词只能统计一次. 搜索了一下网上的题解,发现好多代码都是一大抄的啊,⊙﹏⊙b汗. 本博客的乃是原创代码,代码风格也是差不多固定的,转载请注明出处:http://blog.c

hdu 2222 Keywords Search(ac自动机入门题)

1 /************************************************************ 2 题目: Keywords Search(hdu 2222) 3 链接: http://acm.hdu.edu.cn/showproblem.php?pid=2222 4 算法: ac自动机 5 算法思想: 多个字符串匹配,也就是相当于多个kmp 6 ***********************************************************

HDU 2222 Keywords Search (AC自动机入门 模板)

AC自动机入门 Aho-Corasick automaton,该算法在1975年产生于贝尔实验室,是著名的多模匹配算法之一.学习AC自动机之前得先有Trie树和KMP模式匹配算法的基础. AC自动机算法分为3步:1.构造一棵tire树  2.构造失败指针  3.进行模式匹配 AC自动机的优化:Trie图 Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Other

HDU 2222 Keywords Search (AC自动机模板题)

Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 67950    Accepted Submission(s): 22882 Problem Description In the modern time, Search engine came into the life of everybody lik

HDU 2222 Keywords Search AC自动机

Keywords Search Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 131072/131072 K (Java/Others)Total Submission(s): 67122    Accepted Submission(s): 22584 Problem Description In the modern time, Search engine came into the life of everybody lik

hdu 2222 Keywords Search ac自动机入门

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 题意:有N(N <= 10000)个长度不超过50的模式串和一个长度不超过1e6的文本串.其中模式串可以重复.问有多少文本串在模式串中出现过.(对于相同的模式串次数仍然累加) 思路:ac自动机裸题: KMP是先将文本串进行匹配得到失配边f[];但是并不适用于文本串较长,模式串较多的情况.因为每次查询的时间复杂度为O(n+m).n,m分别为文本串和模式串的长度: ac自动机就是建立在Trie上,

HDU 2222 Keywords Search(AC自动机模板题)

原题大意:原题链接 先给定T个单词,然后给定一个字符串,查询该字符串中包含多少个给定的单词 解题思路:AC自动机模板题 参考链接:哔哩哔哩算法讲堂 WA版本 注意:因为输入的单词可能有重复,那么Insert()函数中p->id=id;语句中p->id会被覆盖,在Query()函数中会一次性全部被清零,导致不能查询重复单词,以至于结果res错误. #include<queue> #include<cstdio> #include<cstring> using

HDU 2222 Keywords Search AC自动机模板

题目链接: hdu2222 代码: #include<iostream> #include<cstdio> #include<string> #include<cstring> #include<queue> using namespace std; struct node { int sum; node* fail; node* next[26]; node() { sum=0; fail=NULL; for(int i=0; i<26;

HDU 2222 Keyword Search AC自动机模板

#include <algorithm> #include <iostream> #include <cstring> #include <cstdlib> #include <cstdio> #include <queue> #include <cmath> #include <stack> #include <map> #include <ctime> #include <io

hdoj 2222 Keywords Search(AC自动机)

题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2222 思路分析:该问题为多模式匹配问题,使用AC自动机解决:需要注意的问题是如何统计该待查询的字符串包含的关键字: 假设待查找的字符串为str[0..n],则str[i…j]可能为某一个关键字:假设当前正在匹配字符str[k],则以str[i..k]为关键字的所有可能 可能的关键字的最后一个字符为str[k],使用fail指针进行跳转并判断以str[k]结尾的该结点是否为关键字最后一个结点,重复进行