[AHOI2005] 病毒检测 - Trie,BFS

给定一个模板串,里面带有 * (可以匹配任意一段可以为空的串)和 ? (可以匹配任意一个字母),然后给定 \(n\) 个询问串,问有多少询问串不能匹配。\(n \leq 500, len \leq 1000\)

Solution

对所有询问串建立字典树,然后考虑一个 BFS 过程,状态表示为 \((i,j)\),即模板串正要处理第 \(i\) 个字符,而字典树上走到了 \(j\) 位置,然后讨论模板串的这一位来转移

  • 如果模板串的这一位是字母,则模板串走一位,结点走对应字母的转移边
  • 如果模板串的这一位是 ?,则模板串走一位,结点走所有字母的转移边
  • 如果模板串的这一位是 *,则
    • 模板串不走,结点走所有字母的转移边
    • 模板串走一位,结点不走

这样就涵盖了所有的转移方法

每走到一个节点,如果 \(i=n+1\),我们就把 \(j\) 这个节点打上标记

最后统计所有的打标记的结点中包含了多少个询问串的结束位置即可

为了优化效率,当一个点被打过标记后,下次再走到这个点就直接跳过;走过的状态搞个哈希表记录一下,再走时候直接弹掉

用了双哈希

#include <bits/stdc++.h>
using namespace std;

const int N = 1000005;
int n,m,str[N],ch[N][4],fg[N],val[N],ind=1;
char buf[N];
const int mod1 = 492837465, mod2 = 400000007;
bitset <mod1> b1;
bitset <mod2> b2;
int gen1(int i,int j) {
    return (1ll*j*31415926+i)%mod1;
}
int gen2(int i,int j) {
    return (1ll*j*998244353+i)%mod2;
}

struct status {int i,j;};

int tr(char c) {
    if(c=='A') return 0;
    if(c=='C') return 1;
    if(c=='T') return 2;
    if(c=='G') return 3;
}

signed main() {
    ios::sync_with_stdio(false);
    scanf("%s",buf+1);
    n=strlen(buf+1);
    for(int i=1;i<=n;i++) {
        if(buf[i]=='A') str[i]=0;
        if(buf[i]=='C') str[i]=1;
        if(buf[i]=='T') str[i]=2;
        if(buf[i]=='G') str[i]=3;
        if(buf[i]=='?') str[i]=4;
        if(buf[i]=='*') str[i]=5;
    }
    scanf("%d",&m);
    for(int i=1;i<=m;i++) {
        scanf("%s",buf+1);
        int len=strlen(buf+1);
        int p=1;
        for(int j=1;j<=len;j++) {
            int x=tr(buf[j]);
            if(ch[p][x]==0) ch[p][x]=++ind;
            p=ch[p][x];
        }
        val[p]++;
    }
    queue <status> q;
    q.push({1,1});
    while(q.size()) {
        status p=q.front();
        q.pop();
        int i=p.i, j=p.j;
        if(b1[gen1(i,j)]&&b2[gen2(i,j)]) continue;
        b1[gen1(i,j)]=1;
        b2[gen2(i,j)]=1;
        if(i==n+1) {
            fg[j]=1;
        }
        else if(!fg[j] && j) {
            if(str[i]<4) {
                q.push({i+1,ch[j][str[i]]});
            }
            if(str[i]==4) {
                if(ch[j][0]) q.push({i+1,ch[j][0]});
                if(ch[j][1]) q.push({i+1,ch[j][1]});
                if(ch[j][2]) q.push({i+1,ch[j][2]});
                if(ch[j][3]) q.push({i+1,ch[j][3]});
            }
            if(str[i]==5) {
                if(ch[j][0]) q.push({i,ch[j][0]});
                if(ch[j][1]) q.push({i,ch[j][1]});
                if(ch[j][2]) q.push({i,ch[j][2]});
                if(ch[j][3]) q.push({i,ch[j][3]});
                q.push({i+1,j});
            }
        }
    }
    int ans=0;
    for(int i=1;i<=ind;i++) ans+=fg[i]*val[i];
    cout<<m-ans;
}

原文地址:https://www.cnblogs.com/mollnn/p/12445027.html

时间: 2024-11-09 02:13:37

[AHOI2005] 病毒检测 - Trie,BFS的相关文章

Luogu_P2536 [AHOI2005]病毒检测 trie树+dfs

Luogu_P2536 [AHOI2005]病毒检测 ### trie树+dfs 题目链接 这两个符号比较有意思 可以把所有的串都先建到trie树上 然后用病毒的模式串在上面搜索 处理这两个符号就可以通过搜索次序解决 主要可以看代码 问的是非病毒,WA了 一个符号可以不取,又WA了 代码如下: #include<bits/stdc++.h> using namespace std; string bd,w[1010]; int ans,n,trie[250010][10],tot=1,ed[2

Linux 病毒检测

推荐迁出重要文件后重装系统 1 Linux 病毒检测 1.1 查找最近登陆 1.1.1 检查系统错误登陆日志,统计IP重试次数 lastb root | awk '{print $3}' | sort | uniq -c | sort -nr| more 1.1.2 查看最近登录的账户和登录时间 last # 查看最近成功登陆的用户: lastlog # 查看每个用户最后一次登陆的时间: 1.1.3 查找远程登录成功的IP: grep -i Accepted /var/log/secure 1.

[bzoj1966][Ahoi2005][VIRUS 病毒检测] (字符串dp)

Description 科学家们在Samuel星球上的探险仍在继续.非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地.科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A.C.T.G组成的序列.科学家们也总结出了Samuel星球上的“病毒模版片段”.一个模版片段是由A.C.T.G的序列加上通配符 * 和 ? 来表示.其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是

bzoj1966: [Ahoi2005]VIRUS 病毒检测

Description 科学家们在Samuel星球上的探险仍在继续.非常幸运的,在Samuel星球的南极附近,探险机器人发现了一个巨大的冰湖!机器人在这个冰湖中搜集到了许多RNA片段运回了实验基地.科学家们经过几个昼夜的研究,发现这些RNA片段中有许多是未知的病毒!每个RNA片段都是由A.C.T.G组成的序列.科学家们也总结出了Samuel星球上的“病毒模版片段”.一个模版片段是由A.C.T.G的序列加上通配符 * 和 ? 来表示.其中 * 的意思是可以匹配上0个或任意多个字符,而 ? 的意思是

HDU 2896 病毒侵袭 Trie图

题目大意:给一些病毒字符串,问一些网址中有哪些病毒. 思路:AC自动机挺裸的题,但是听说Trie图还好写,时间还快,以后就不写AC自动机了,直接啥题都上Trie图吧. 注意:此题输出结尾要加回车,否则会PE! CODE: #include <queue> #include <cstdio> #include <cstring> #include <iostream> #include <algorithm> using namespace std

BZOJ 1967 Ahoi2005 CROSS 穿越磁场 FloodFill+BFS

题目大意:给定平面上的n个正方形,求某个点到另一个点至少穿过多少个边界 一开始想对于每个正方形判断一下起点和终点是否在同一侧= = 但是反例显然 考虑到n<=100,可以离散化一下,然后用Floodfill标记每块区域 然后跑最短路就行了--由于边权都是1,所以用BFS就能搞出最短路了 连边连挂了调了半宿-- #include <cstdio> #include <cstring> #include <iostream> #include <algorith

*管家病毒查杀原理逆向分析

本文研究的是*管家2.8—3.6版本的杀毒模块功能实现.众所周知,杀毒软件查杀病毒分为主动查杀和被动查杀两种方式.*管家的主动查杀包括快速查收和全盘查杀,而快速查杀和全盘查杀都使用了本地查杀技术和云查杀技术. 快速查杀 快速查杀首先获取系统安装的所有应用.创建"/data/data/com.anguanjia.safe/classes.dex"文件,将待扫描的apk解压,获取包中的classes.dex文件内容写入到"/data/data/com.anguanjia.safe

你会查杀病毒吗?反病毒技巧! 比较长。

现在拥有电脑的朋友们,很多没有经历过DOS时代(绝非以老卖老),仅仅是在图形桌面和鼠标点击下成长的,所以对于引导区.病毒的传染.复制方面不是很了解,有的甚至跟本就不了解.甚至是谈"毒"色变,把机器一切不正常现象都归于-"是有病毒了吧?"非也,告诉大家病毒很简单,人做的程序而已,别怕.其实病毒机理无非就是"感染->优先运行->自我复制->隐藏.破坏->传播"几个步骤.熟悉了这些,我们就可以知道,杀毒到底要从什么方面入手.先就

linux随机10字母病毒

病毒表现: 网络流量暴满,疯狂地向香港的一个IP发数据,同时在top里面表现为随机的10位字母的进程,看/proc里面的信息,则为ls,cd之类常见的命令,CPU利用率也在top之首.杀死该进程后,会再随机产生一个新的进程. 清楚病毒步骤: 查看/proc/_pid/cmdline里面全是伪造信息,随机产生ps.su.top等命令: 由于病毒产生大量的流量,先使用iptables封掉出口IP,当病毒检测流量发布出去后会进入监听状态,监听端口: 想到病毒一般都会有检测机制,所以查找其根文件,cro