ac自动机fail树上按询问建立上跳指针——cf963D

解法看着吓人,其实就是为了优化ac自动机上暴力跳fail指针。。

另外这题对于复杂度的分析很有学习价值

/*
给定一个母串s,再给定n个询问(k,m)
对于每个询问,求出长度最小的t,使t是s的子串,且m作为子串在t中出现了m次

对多串建立ac自动机,然后用s去匹配,把所有询问的出现位置都用vector保存下来
然后对应每个询问的k进行更新答案 

为了保证复杂度:在跳fail不能暴力向上跳,应该直接用一个指针pre跳到上一个带有询问的点
这样每次向上跳都让某个询问的vector更新进一个新的值
由于最多有sqrt(n)个不同的询问串长度,所以以每个s[i]为结尾的可匹配串也只有sqrt(n)个,
即最多在fail树上跳nsqrt(n)次
*/
#include<bits/stdc++.h>
using namespace std;
#define N 200005

struct Query{
    vector<int>pos;
    int k,len;
}q[N];
char s[N],buf[N];
int n;

struct Trie{
    int nxt[N][26],fail[N],id[N],pre[N];
    int root,L;
    int newnode(){
        memset(nxt[L],-1,sizeof nxt[L]);
        id[L]=0;
        return L++;
    }
    void init(){L=0;root=newnode();}
    void insert(char buf[],int ID){
        int len=strlen(buf);
        int now=root;
        for(int i=0;i<len;i++){
            if(nxt[now][buf[i]-‘a‘]==-1)
                nxt[now][buf[i]-‘a‘]=newnode();
            now=nxt[now][buf[i]-‘a‘];
        }
        id[now]=ID;
    }
    void build(){
        queue<int>q;
        fail[root]=root;
        for(int i=0;i<26;i++)
            if(nxt[root][i]==-1)
                nxt[root][i]=root;
            else {
                fail[nxt[root][i]]=root;
                q.push(nxt[root][i]);
            }
        pre[root]=0;

        while(q.size()){
            int now=q.front();q.pop();//此时now的fail已经建立好
            if(id[fail[now]]!=0)//找上一个询问的位置
                pre[now]=fail[now];
            else
                pre[now]=pre[fail[now]];

            for(int i=0;i<26;i++)
                if(nxt[now][i]==-1)
                    nxt[now][i]=nxt[fail[now]][i];
                else {
                    fail[nxt[now][i]]=nxt[fail[now]][i];
                    q.push(nxt[now][i]);
                }
        }
    }

    void query(char *s){
        int len=strlen(s);
        int now=root;
        for(int i=0;i<len;i++){
            now=nxt[now][s[i]-‘a‘];
            //通过pre向上跳
            int p=now;
            while(p){
                q[id[p]].pos.push_back(i);
                p=pre[p];
            }
        }

    }
}ac;

int main(){
    ac.init();
    scanf("%s",s);
    cin>>n;
    for(int i=1;i<=n;i++){
        scanf("%d%s",&q[i].k,buf);
        q[i].len=strlen(buf);
        ac.insert(buf,i);
    }
    ac.build();
    ac.query(s);

//for(int i=1;i<=ac.L;i++)
//    cout<<ac.pre[i]<<" ";

    //处理每个询问
    for(int i=1;i<=n;i++){
//cout<<q[i].pos.size()<<"\n";
        if(q[i].pos.size()<q[i].k){
            puts("-1");continue;
        }

        int ans=0x3f3f3f3f;
        for(int j=q[i].k-1;j<q[i].pos.size();j++){
            ans=min(ans,q[i].pos[j]-q[i].pos[j-q[i].k+1]+q[i].len);
        }
        cout<<ans<<‘\n‘;
    }
}
/*

aaabbbbaaabababab
27
2 aaabbbbaaaba
2 baaabab
1 abbbbaaabab
1 aabbbbaaabab
6 a
1 aaabbbbaaabababab
2 aaba
2 abbbba
5 aa
2 aaabbbb
2 abababa
3 aba
2 baaa
2 bbaaababa
1 aaabab
1 abbb
1 bbbbaaabababa
1 baaab
1 abbbbaaabababa
1 aaababa
1 ababab
2 abb
2 baaabababa
1 bbaaabababa
2 aaabb
1 abababab
4 bab

*/

原文地址:https://www.cnblogs.com/zsben991126/p/11701240.html

时间: 2024-10-10 06:07:53

ac自动机fail树上按询问建立上跳指针——cf963D的相关文章

BZOJ 题目3172: [Tjoi2013]单词(AC自动机||AC自动机+fail树||后缀数组暴力||后缀数组+RMQ+二分等五种姿势水过)

3172: [Tjoi2013]单词 Time Limit: 10 Sec  Memory Limit: 512 MB Submit: 1890  Solved: 877 [Submit][Status][Discuss] Description 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. Input 第一个一个整数N,表示有多少个单词,接下来N行每行一个单词.每个单词由小写字母组成,N<=200,单词长度不超过10^6

[BZOJ2434]NOI2011阿狸的打字机|AC自动机|fail树|树状数组

这题真是太神了,好多实用的技巧..首先肯定是要先把每个要输出的串当模式串把自动机给建出来的,如果一个一个串复制出来再一个个插入显然非常慢...我们用在自动机上插入模式串的方法来建,初始时在0,新加一个字符就想下爬(或者新建),维护一个父亲指针,删除的时候就可以爬上去,这样就可以O(n)建出来了.. 再考虑询问的问题,每次把串拿出来再放进自动机跑一遍显然太慢..这里需要用到一个叫做fail树的东西,就是把fail指针当做边建成的一颗树..比如fail(i)=j,那么i在fail树上的父节点就是j.

【bzoj2434】阿狸的打字机-AC自动机+fail树+优化

http://acm.hust.edu.cn/vjudge/problem/viewProblem.action?id=23083 Description 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机.打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母. 经阿狸研究发现,这个打字机是这样工作的: l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最后). l 按一下印有'B'的按键,打字机凹槽中最后一个字母会消失. l 按一下印有'P'的

BZOJ 2434: [Noi2011]阿狸的打字机 [AC自动机 Fail树 树状数组 DFS序]

2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2545  Solved: 1419[Submit][Status][Discuss] Description 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机.打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母.经阿狸研究发现,这个打字机是这样工作的:l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最

【AC自动机/fail树】BZOJ3172- [Tjoi2013]单词

[题目大意] http://www.lydsy.com:808/JudgeOnline/problem.php?id=3172 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. [思路] 第一次写fail树.首先建立AC自动机,对于路径上的每一个点sum++,表示出现的次数.fail指针指向的后缀,如果从fail指针指向的点开始方向建立fail树,其子树的sum之和就等于以它作为后缀的串的总数,相当于它在文章中出现的个数. *

AC自动机 &amp; fail树

[BZOJ 1195] 最短母串 题意 给定 n (n <= 12) 个子串 s (|s| <= 60) , 求一个最短母串. 分析 建 AC 自动机. 设 St 为每个点的状态, 在 fail 树上下传一下. 直接 BFS 找到第一个满的状态 (Node, State) . [BZOJ 4327] [JSOI 2012] 玄武密码 题意 给定一个母串和若干个模式串. 求每个模式串最多能在母串上匹配多少位. |S| <= 10000000, |T| <= 100, m <=

【BZOJ-2434】阿狸的打字机 AC自动机 + Fail树 + DFS序 + 树状数组

2434: [Noi2011]阿狸的打字机 Time Limit: 10 Sec  Memory Limit: 256 MBSubmit: 2022  Solved: 1158[Submit][Status][Discuss] Description 阿狸喜欢收藏各种稀奇古怪的东西,最近他淘到一台老式的打字机.打字机上只有28个按键,分别印有26个小写英文字母和'B'.'P'两个字母.经阿狸研究发现,这个打字机是这样工作的:l 输入小写字母,打字机的一个凹槽中会加入这个字母(这个字母加在凹槽的最

LG5357 「模板」AC自动机(二次加强版) AC自动机+fail树

问题描述 LG5357 题解 不是fail树的AC自动机复杂度是假的. 把AC自动机搞出来,建立Trie树,树上爆搜一遍就好了. \(\mathrm{Code}\) #include<bits/stdc++.h> using namespace std; template <typename Tp> void read(Tp &x){ x=0;char ch=1;int fh; while(ch!='-'&&(ch>'9'||ch<'0')) c

BZOJ 3172: [Tjoi2013]单词 [AC自动机 Fail树]

3172: [Tjoi2013]单词 Time Limit: 10 Sec  Memory Limit: 512 MBSubmit: 3198  Solved: 1532[Submit][Status][Discuss] Description 某人读论文,一篇论文是由许多单词组成.但他发现一个单词会在论文中出现很多次,现在想知道每个单词分别在论文中出现多少次. Input 第一个一个整数N,表示有多少个单词,接下来N行每行一个单词.每个单词由小写字母组成,N<=200,单词长度不超过10^6