LightOJ 1427 Substring Frequency (II) (AC自动机)

题意:给定一个文本串和 n 个子串,问你子串在文本串出现的次数。

析:很明显的AC自动机,只要把先把子串进行失配处理,然后再去用文本串去匹配,在插入子串时就要标记每个串,注意串可能是相同的,这个我错了两次,最后匹配一次就OK了。

代码如下:

#pragma comment(linker, "/STACK:1024000000,1024000000")
#include <cstdio>
#include <string>
#include <cstdlib>
#include <cmath>
#include <iostream>
#include <cstring>
#include <set>
#include <queue>
#include <algorithm>
#include <vector>
#include <map>
#include <cctype>
#include <cmath>
#include <stack>
#include <sstream>
#define debug() puts("++++");
#define gcd(a, b) __gcd(a, b)
#define lson l,m,rt<<1
#define rson m+1,r,rt<<1|1
#define freopenr freopen("in.txt", "r", stdin)
#define freopenw freopen("out.txt", "w", stdout)
using namespace std;

typedef long long LL;
typedef unsigned long long ULL;
typedef pair<int, int> P;
const int INF = 0x3f3f3f3f;
const LL LNF = 1e16;
const double inf = 0x3f3f3f3f3f3f;
const double PI = acos(-1.0);
const double eps = 1e-8;
const int maxn = 1e6 + 10;
const int mod = 1e9 + 7;
const int dr[] = {-1, 0, 1, 0};
const int dc[] = {0, 1, 0, -1};
const char *de[] = {"0000", "0001", "0010", "0011", "0100", "0101", "0110", "0111", "1000", "1001", "1010", "1011", "1100", "1101", "1110", "1111"};
int n, m;
const int mon[] = {0, 31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31};
const int monn[] = {0, 31, 29, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31};
inline bool is_in(int r, int c){
  return r >= 0 && r < n && c >= 0 && c < m;
}

char t[maxn];
char s[510][510];
const int maxnode = 510 * 510 + 10;
struct Aho{
  int ch[maxnode][26];
  int f[maxnode];
  int val[maxnode];
  int last[maxnode];
  int cnt[510];
  int sz;

  void init(){
    sz = 1;
    memset(ch[0], 0, sizeof ch[0]);
    memset(cnt, 0, sizeof cnt);
  }

  int idx(char c){ return c - ‘a‘; }

  void insert(char *s, int v){
    int u = 0;
    while(*s){
      int c = idx(*s);
      if(!ch[u][c]){
        memset(ch[sz], 0, sizeof ch[sz]);
        val[sz] = 0;
        ch[u][c] = sz++;
      }
      u = ch[u][c];
      ++s;
    }
    val[u] = v;
  }

  void getFail(){
    queue<int> q;
    f[0] = 0;
    for(int c = 0; c < 26; ++c){
      int u = ch[0][c];
      if(u){ f[u] = 0; q.push(u); last[u] = 0; }
    }
    while(!q.empty()){
      int r = q.front();  q.pop();
      for(int c = 0; c < 26; ++c){
        int u = ch[r][c];
        if(!u)  continue;
        q.push(u);
        int v = f[r];

        while(v && !ch[v][c]) v = f[v];
        f[u] = ch[v][c];
        last[u] = val[f[u]] ? f[u] : last[f[u]];
      }
    }
  }

  void find(char *s){
    int j = 0;
    while(*s){
      int c = idx(*s);
      while(j && !ch[j][c])  j = f[j];
      j = ch[j][c];
      if(val[j])  print(j);
      else if(last[j])  print(last[j]);
      ++s;
    }
  }

  void print(int j){
    if(j){
      ++cnt[val[j]];
      print(last[j]);
    }
  }

};

Aho aho;
map<string, int> mp;

int main(){
  int T;  cin >> T;
  for(int kase = 1; kase <= T; ++kase){
    scanf("%d", &n);
    scanf("%s", t);
    aho.init();
    mp.clear();
    for(int i = 1; i <= n; ++i){
      scanf("%s", s+i);
      if(mp.count(s[i]))  continue;
      mp[s[i]] = i;
      aho.insert(s[i], i);
    }
    aho.getFail();
    aho.find(t);
    printf("Case %d:\n", kase);
    for(int i = 1; i <= n; ++i)
      printf("%d\n", aho.cnt[mp[s[i]]]);
  }
  return 0;
}

  

时间: 2024-10-14 07:00:24

LightOJ 1427 Substring Frequency (II) (AC自动机)的相关文章

LightOJ 题目1427 - Substring Frequency (II)(AC自己主动机)

1427 - Substring Frequency (II) PDF (English) Statistics Forum Time Limit: 5 second(s) Memory Limit: 128 MB A string is a finite sequence of symbols that are chosen from an alphabet. In this problem you are given a string T and n queries each with a

Zoj 3535 Gao the String II (AC自动机+dp)

题目大意: 用集合A中的串构造出一个串,使之让更多的setB中的串成为他的子串. 思路分析: 和 Codeforces 86C 差不多. 不过这里是要用A中的构造. 先用A 和 B的串构造一个自动机.然后对于A集合的尾结点给出一个最大后缀匹配,对于B集合的尾结点给一个权值. dp[i][j][k] 表示已经构造出来了一个长度为i的串,现在走到了自动机的j结点,i长度后面有k个字符是没有匹配到的. 继续在自动机上走进行状态转移. if(isword >= k +1 )dp [i+1] [j->n

LightOJ 1427(AC自动机

题目:给出若干模板串和一个母串,求每个模板串在母串中出现的次数. 思路:AC自动机+后缀链接(last数组) /* * @author: Cwind */ ///#pragma comment(linker, "/STACK:102400000,102400000") #include <iostream> #include <map> #include <algorithm> #include <cstdio> #include <

uva 11468 - Substring(AC自动机+概率)

题目链接:uva 11468 - Substring 题目大意:给出一些字符和各自字符对应的选择概率,随机选择L次后得到一个长度为L的字符串,要求该字符串不包含任意一个子串的概率. 解题思路:构造AC自动机之后,每随机生成一个字母,等于是在AC自动机上走一步,所有子串的结束位置的节点标记为禁止通行,然后问题转换成记忆搜索处理. #include <cstdio> #include <cstring> #include <queue> #include <algor

UVA 11468 - Substring(AC自动机)

UVA 11468 - Substring 题目链接 题意:给定一些模式串,然后给出一些字母出现的概率,每次随机出现一个字母,要求出这些字母出现L个组成的字符串不包含(即不是它的连续字串)已有模式串的概率 思路:AC自动机,先构造出AC自动机,构造的时候利用next数组的特性,记录下每个位置是否有经过一个单词结点,如果有这个结点就是不能走的结点,那么问题就变成了只能在能走的结点上走L步的概率,注意这里空边也要处理成可以走(走到它的next,因为不匹配的话就一直找到next能匹配的位置),然后进行

暑假 D6 T1 substring(AC自动机)

题目描述 给出一个长度为n的文本串,有Q次询问,每次给出一个字符串S,询问S是否在文本串中出现过 输入格式 第一行为两个整数n和Q,分别表示文本串长度和询问次数 第二行为长为n的文本串 接下来Q行,每行为一个字符串S 输出格式 输出Q行对应Q次询问的答案,若出现过则输出YES,否则输出NO 数据范围 对于100%的数据n,Q≤100000,且保证S为长度不超过100000的回文串,且所有的S的总长不超过1000000,保证所有字符都是小写字母. 题解 昨天才做了阿狸的打字机,就想到是一样的,而且

UVa 11468 Substring (AC自动机+概率DP)

题意:给出一个字母表以及每个字母出现的概率.再给出一些模板串S.从字母表中每次随机拿出一个字母,一共拿L次组成一个产度为L的串, 问这个串不包含S中任何一个串的概率为多少? 析:先构造一个AC自动机,然后随机生成L个字母,就是在AC自动机的某个结点走多少步,dp[i][j] 表示在 i 结点,并且剩下 j 步, 然后记忆化搜索就OK了. 代码如下: #pragma comment(linker, "/STACK:1024000000,1024000000") #include <

UVA 11468 Substring (AC自动机)

用把失配边也加到正常边以后AC自动机,状态是长度递减的DAG,每个选一个不会匹配字符的转移. dp[u][L]表示当前在tire树上u结点长度还剩L时候不匹配的概率,根据全概率公式跑记忆化搜索. #include<bits/stdc++.h> using namespace std; typedef double ld; const int maxnds = 21*21, sigma_size = 62; int nds; int ch[maxnds][sigma_size]; double

UVa 11468 (AC自动机 概率DP) Substring

将K个模板串构成一个AC自动机,那些能匹配到的单词节点都称之为禁止节点. 然后问题就变成了在Tire树上走L步且不经过禁止节点的概率. 根据全概率公式用记忆化搜索求解. 1 #include <cstdio> 2 #include <cstring> 3 #include <queue> 4 using namespace std; 5 6 const int maxnode = 500; 7 const int sigma_size = 64; 8 int idx[2