hdu2896 AC自动机

病毒侵袭

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)
Total Submission(s): 11422    Accepted Submission(s): 2957

Problem Description

当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻。。。。在这样的时刻,人们却异常兴奋——我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~
但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒。小t不幸成为受害者之一。小t如此生气,他决定要把世界上所有带病毒的网站都找出来。当然,谁都知道这是不可能的。小t却执意要完成这不能的任务,他说:“子子孙孙无穷匮也!”(愚公后继有人了)。
万事开头难,小t收集了好多病毒的特征码,又收集了一批诡异网站的源码,他想知道这些网站中哪些是有病毒的,又是带了怎样的病毒呢?顺便还想知道他到底收集了多少带病毒的网站。这时候他却不知道何从下手了。所以想请大家帮帮忙。小t又是个急性子哦,所以解决问题越快越好哦~~

Input

第一行,一个整数N(1<=N<=500),表示病毒特征码的个数。
接下来N行,每行表示一个病毒特征码,特征码字符串长度在20—200之间。
每个病毒都有一个编号,依此为1—N。
不同编号的病毒特征码不会相同。
在这之后一行,有一个整数M(1<=M<=1000),表示网站数。
接下来M行,每行表示一个网站源码,源码字符串长度在7000—10000之间。
每个网站都有一个编号,依此为1—M。
以上字符串中字符都是ASCII码可见字符(不包括回车)。

Output

依次按如下格式输出按网站编号从小到大输出,带病毒的网站编号和包含病毒编号,每行一个含毒网站信息。
web 网站编号: 病毒编号 病毒编号 …
冒号后有一个空格,病毒编号按从小到大排列,两个病毒编号之间用一个空格隔开,如果一个网站包含病毒,病毒数不会超过3个。
最后一行输出统计信息,如下格式
total: 带病毒网站数
冒号后有一个空格。

Sample Input

3
aaa
bbb
ccc
2
aaabbbccc
bbaacc

Sample Output

web 1: 1 2 3
total: 1

AC自动机裸题。因为字符串开小了WA了好久....

#include<cstdio>
#include<cstdlib>
#include<algorithm>
#include<cmath>
#include<cstring>

using namespace std;

struct node{
    node *fail;
    node *son[128];
    int num;
    node()
    {
        fail=NULL;
        for(int i=0;i<128;i++)son[i]=NULL;
        num=0;
    }
} *que[100101];
node *root;
int ans[11];
int ple,xzq,i,j,k,t,m,n,tl;
char s[100101];
bool vis[511];

void add(int x)
{
    int i,ts;
    node *p;
    p=root;
    for(i=0;i<n;i++){
        ts=s[i];
        if(p->son[ts]==NULL)p->son[ts]=new node();
        p=p->son[ts];
    }
    p->num=x;
}

void bfs()
{
    node *p;
    node *q;
    int l,r,i,x,j,k;
    l=r=1;
    que[1]=root;
    while(l<=r){
        p=que[l];
        for(i=0;i<128;i++)if(p->son[i]!=NULL){
            r++;
            que[r]=p->son[i];
            if(p==root)p->son[i]->fail=root;
            else{
                q=p->fail;
                while(q!=NULL){
                    if(q->son[i]!=NULL){
                        p->son[i]->fail=q->son[i];
                        break;
                    }
                    q=q->fail;
                }
                if(p->son[i]->fail==NULL)p->son[i]->fail=root;
            }
        }
        l++;
    }
}

void work()
{
    int i,ts;
    node *p;
    node *q;
    p=root;
    for(i=0;i<n;i++){
        ts=s[i];
        if(p->son[ts]!=NULL)p=p->son[ts];
        else{
            if(p==root)p=root;
            else{
                q=p->fail;
                while(q!=NULL){
                    if(q->son[ts]!=NULL){
                        p=q->son[ts];
                        break;
                    }
                    q=q->fail;
                }
                if(q==NULL)p=root;
            }
        }
        if(p->num!=0){
            vis[p->num]=true;
            ple++;
            q=p->fail;
            while(q!=NULL){
                if(q->num!=0)vis[q->num]=true;
                q=q->fail;
            }
        }
    }
}

int main()
{
    scanf("%d",&t);
    root=new node();
    for(i=1;i<=t;i++){
        scanf("%s",&s);
        n=strlen(s);
        add(i);
    }
    bfs();
    scanf("%d",&m);
    for(i=1;i<=m;i++){
        ple=0;
        scanf("%s",&s);
        n=strlen(s);
        memset(vis,false,sizeof(vis));
        work();
        if(ple!=0){
            xzq++;
            printf("web %d:",i);
            for(j=1;j<=t;j++)if(vis[j])printf(" %d",j);
            printf("\n");
        }
    }
    printf("total: %d\n",xzq);
}
时间: 2024-10-16 05:55:47

hdu2896 AC自动机的相关文章

【HDU2896】病毒侵袭 AC自动机

[HDU2896]病毒侵袭 Problem Description 当太阳的光辉逐渐被月亮遮蔽,世界失去了光明,大地迎来最黑暗的时刻....在这样的时刻,人们却异常兴奋--我们能在有生之年看到500年一遇的世界奇观,那是多么幸福的事儿啊~~但网路上总有那么些网站,开始借着民众的好奇心,打着介绍日食的旗号,大肆传播病毒.小t不幸成为受害者之一.小t如此生气,他决定要把世界上所有带病毒的网站都找出来.当然,谁都知道这是不可能的.小t却执意要完成这不能的任务,他说:"子子孙孙无穷匮也!"(愚

hdu2896 病毒侵袭 AC自动机入门题 N(N &lt;= 500)个长度不大于200的模式串(保证所有的模式串都不相同), M(M &lt;= 1000)个长度不大于10000的待匹配串,问待匹配串中有哪几个模式串,

/** 题目:hdu2896 病毒侵袭 链接:http://acm.hdu.edu.cn/showproblem.php?pid=2896 题意:N(N <= 500)个长度不大于200的模式串(保证所有的模式串都不相同), M(M <= 1000)个长度不大于10000的待匹配串,问待匹配串中有哪几个模式串, 题目保证每个待匹配串中最多有三个模式串. 思路:ac自动机做法,字符为可见字符,那么直接就是他们的ascii值作为每一个字符的标志.最多128: 由于不超过三个,所以找到3个就可以re

HDU2896病毒侵袭(ac自动机)

网上很多代码都略显繁琐,看了一下yy dalao的代码感觉很好,但他懒得打题解(好吧我也是 以0为根节点的话,我把yy的一段代码删了改用fail[c]=x==0?0:ch[fail[x]][i];来实现特判,效果还不错! 也算是AC自动机的模版题吧,用了一个id数组来储藏每一个特征码的最后一个字符所在位置,再用vis来看网站源码中有哪条特征码(即哪条特征码的id被访问到 #include<cstdio> #include<cstring> using namespace std;

【小结】AC自动机

参考资料:http://blog.csdn.net/niushuai666/article/details/7002823 搞了两天,突然明白,这玩意它原来就是个DFA鸭!窝来分析分析 从DFA到AC自动机: 考虑以下单词: {she, he, her},字母表∑为26个小写字母 我们先画出它Trie树的模样 注意,双圈的是包含单词结尾的位置.然后我们尝试将它稍加改造,变成一个DFA! 对每一个状态,必须补充下一个字母为其它(比如从起始状态出发,输入一个h,匹配上了,接下来输入可能为a-z,我们

病毒的侵扰和再侵扰两道AC自动机的应用

HDU2896 病毒的侵扰 http://vjudge.net/problem/viewProblem.action?id=16404 题目大意: 记录每个病毒的编号,并给出一些网站的源码,分别输出网站及其对应编号中所含病毒的编号,没有就不输出 最后输出有病毒网站的个数 这道题需要注意的是这个所有ASCII码均会用到,所以我之前傻傻地写str[i]-'a'还不知为什么会错简直苦逼~~ 这里直接用ch[now][str[i]]找到对应位置即可 因为要记录编号,为了防止重复访问,我对query中进行

AC自动机入门和几道例题

一直被AC自动机这个名字唬住,以为很难,自动AC?其实不是.数模还有CA自动机(元胞自动机),听起来也怪吓人的,对ACM选手来说,算是一种模拟. AC自动机=字典树+KMP.字典树是必须要懂的:KMP主要了解一下回溯思想,问题不大. KMP解决的是一个母串和一个模式串的匹配问题. 字典树解决的是许多字符串的前缀和问题. AC自动机解决的是一个母串和许多模式串的匹配问题,把所有的模式串搞成一棵字典树,再用母串去字典树上跑. 引入失配指针的概念,对于当前遍历到的母串某个字符,在字典树中找不下去了,不

暑假集训day9补充(AC自动机)

推荐网站http://blog.csdn.net/niushuai666/article/details/7002823 AC自动机嘛,此AC(aho-corasick)非彼AC(Accepted). 我也不是很会解释 有一题是必须打的hdu2222. #include<iostream> #include<cstdio> #include<cstring> #include<queue> using namespace std; const int mn=

ac自动机基础模板(hdu2222)

In the modern time, Search engine came into the life of everybody like Google, Baidu, etc. Wiskey also wants to bring this feature to his image retrieval system. Every image have a long description, when users type some keywords to find the image, th

HDU 2825 Wireless Password AC自动机+dp

训练赛第二场的I题,上完体育课回来就把这题过了,今天训练赛rank1了,还把大大队虐了,而且我还过了这道题 (虽然我也就过了这道题...),第一次在比赛中手写AC自动机还带dp的,心情大好. 给一个字符串集合,求包含该集合超过K个字符的,长度为L的字符串的个数. 显然是在AC自动机上跑dp,设dp[u][L][k]表示当前在结点u,还要走L步,当前状态为k的个数.一开始第三维表示的是包含k个字符串,但是题目要求不含重复的,那就只能状压了.转移为dp[u][L][k]+=dp[v][L-1][nk