POJ 2778 DNA Sequence —— (AC自动机+矩阵快速幂)

  距离上次做AC自动机有很久了=。=,以前这题的思路死活看不懂,现在还是觉得很好理解的。

  思路参见:http://blog.csdn.net/morgan_xww/article/details/7834801#

  我用cnt=1表示这个节点是危险的,然后再匹配fail指针的时候,如果一个节点的前缀是危险的,那么这个节点也是危险的,这么维护即可。

  顺便一提,我以前的AC自动机模板是没有build过程中失配时的nxt指针的(以前是在match的过程中体现),但是失败时候需要的nxt指针又是很好用的,因此以后的模板中在build中新增这个内容(其实上次的AC自动机DP中就已经有了)。

  另外两点可能不是很重要的是:1.我的矩阵模板统一是从1开始的,而这里有0节点;2.在结构体内似乎不能直接初始化字符串= =。

  代码如下(我的代码跑的有点慢。。):

  1 #include <stdio.h>
  2 #include <algorithm>
  3 #include <string.h>
  4 #include <vector>
  5 #include <queue>
  6 using namespace std;
  7 const int MAX_Tot = 100 + 50;
  8 const int mod = 100000;
  9
 10 int m,n;
 11
 12 void add(int &a,int b)
 13 {
 14     a += b;
 15     if(a < 0) a += mod;
 16     a %= mod;
 17 }
 18
 19 struct matrix
 20 {
 21     int e[MAX_Tot][MAX_Tot],n,m;
 22     matrix() {}
 23     matrix(int _n,int _m): n(_n),m(_m) {memset(e,0,sizeof(e));}
 24     matrix operator * (const matrix &temp)const
 25     {
 26         matrix ret = matrix(n,temp.m);
 27         for(int i=1;i<=ret.n;i++)
 28         {
 29             for(int j=1;j<=ret.m;j++)
 30             {
 31                 for(int k=1;k<=m;k++)
 32                 {
 33                     add(ret.e[i][j],1LL*e[i][k]*temp.e[k][j]%mod);
 34                 }
 35             }
 36         }
 37         return ret;
 38     }
 39     matrix operator + (const matrix &temp)const
 40     {
 41         matrix ret = matrix(n,m);
 42         for(int i=1;i<=n;i++)
 43         {
 44             for(int j=1;j<=m;j++)
 45             {
 46                 add(ret.e[i][j],(e[i][j]+temp.e[i][j])%mod);
 47             }
 48         }
 49         return ret;
 50     }
 51     void getE()
 52     {
 53         for(int i=1;i<=n;i++)
 54         {
 55             for(int j=1;j<=m;j++)
 56             {
 57                 e[i][j] = i==j?1:0;
 58             }
 59         }
 60     }
 61 };
 62
 63 matrix qpow(matrix temp,int x)
 64 {
 65     int sz = temp.n;
 66     matrix base = matrix(sz,sz);
 67     base.getE();
 68     while(x)
 69     {
 70         if(x & 1) base = base * temp;
 71         x >>= 1;
 72         temp = temp * temp;
 73     }
 74     return base;
 75 }
 76
 77 char way[4] = {‘A‘,‘T‘,‘C‘,‘G‘};
 78 struct Aho
 79 {
 80     struct state
 81     {
 82         int nxt[4];
 83         int fail,cnt;
 84     }stateTable[MAX_Tot];
 85
 86     int find(char c) {for(int i=0;i<4;i++) if(c == way[i]) return i;}
 87
 88     int size;
 89
 90     queue<int> que;
 91
 92     void init()
 93     {
 94         while(que.size()) que.pop();
 95         for(int i=0;i<MAX_Tot;i++)
 96         {
 97             memset(stateTable[i].nxt,0,sizeof(stateTable[i].nxt));
 98             stateTable[i].fail = stateTable[i].cnt = 0;
 99         }
100         size = 1;
101     }
102
103     void insert(char *s)
104     {
105         int n = strlen(s);
106         int now = 0;
107         for(int i=0;i<n;i++)
108         {
109             char c = s[i];
110             int to = find(c);
111             if(!stateTable[now].nxt[to])
112                 stateTable[now].nxt[to] = size++;
113             now = stateTable[now].nxt[to];
114         }
115         stateTable[now].cnt = 1;
116     }
117
118     void build()
119     {
120         stateTable[0].fail = -1;
121         que.push(0);
122
123         while(que.size())
124         {
125             int u = que.front();que.pop();
126             for(int i=0;i<4;i++)
127             {
128                 if(stateTable[u].nxt[i])
129                 {
130                     if(u == 0) stateTable[stateTable[u].nxt[i]].fail = 0;
131                     else
132                     {
133                         int v = stateTable[u].fail;
134                         while(v != -1)
135                         {
136                             if(stateTable[v].nxt[i])
137                             {
138                                 stateTable[stateTable[u].nxt[i]].fail = stateTable[v].nxt[i];
139                                 // 在匹配fail指针的时候顺便更新cnt
140                                 if(stateTable[stateTable[stateTable[u].nxt[i]].fail].cnt == 1)
141                                     stateTable[stateTable[u].nxt[i]].cnt = 1;
142                                 break;
143                             }
144                             v = stateTable[v].fail;
145                         }
146                         if(v == -1) stateTable[stateTable[u].nxt[i]].fail = 0;
147                     }
148                     que.push(stateTable[u].nxt[i]);
149                 }
150                 /*****建立自动机nxt指针*****/
151                 else
152                 {
153                     if(u == 0) stateTable[u].nxt[i] = 0;
154                     else
155                     {
156                         int p = stateTable[u].fail;
157                         while(p != -1 && stateTable[p].nxt[i] == 0) p = stateTable[p].fail;
158                         if(p == -1) stateTable[u].nxt[i] = 0;
159                         else stateTable[u].nxt[i] = stateTable[p].nxt[i];
160                     }
161                 }
162                 /*****建立自动机nxt指针*****/
163             }
164         }
165     }
166
167     matrix build_matrix()
168     {
169         matrix ans = matrix(size,size);
170         for(int i=0;i<size;i++)
171         {
172             for(int j=0;j<4;j++)
173             {
174                 if(!stateTable[i].cnt && !stateTable[stateTable[i].nxt[j]].cnt)
175                     ans.e[i+1][stateTable[i].nxt[j]+1]++;
176             }
177         }
178         return ans;
179     }
180 }aho;
181
182 int main()
183 {
184     while(scanf("%d%d",&m,&n) == 2)
185     {
186         aho.init();
187         char s[15];
188         for(int i=1;i<=m;i++)
189         {
190             scanf("%s",s);
191             aho.insert(s);
192         }
193         aho.build();
194         matrix p = aho.build_matrix();
195         p = qpow(p,n);
196         int ans = 0;
197         for(int i=1;i<=aho.size;i++) add(ans, p.e[1][i]);
198         printf("%d\n",ans);
199     }
200     return 0;
201 }
时间: 2024-10-15 05:37:18

POJ 2778 DNA Sequence —— (AC自动机+矩阵快速幂)的相关文章

POJ POJ 2778 DNA Sequence AC自动机 + 矩阵快速幂

首先建立Trie和失败指针,然后你会发现对于每个节点 i 匹配AGCT时只有以下几种情况: i 节点有关于当前字符的儿子节点 j 且安全,则i 到 j找到一条长度为 1的路. i 节点有关于当前字符的儿子节点 j 且 不安全,则i 到 j没有路. i 节点没有关于当前字符的儿子节点 但是能通过失败指针找到一个安全的节点j,那么 i 到 j 找到一条长度为1的路. 关于节点安全的定义: 当前节点不是末节点且当前节点由失败指针指回跟节点的路径上不存在不安全节点,那么这个节点就是安全节点. 然后问题就

poj 2778 DNA Sequence(AC自动机+矩阵快速幂)

题目链接:poj 2778 DNA Sequence 题目大意:给定一些含有疾病的DNA序列,现在给定DNA长度,问有多少种不同的DNA序列是健康的. 解题思路:对DNA片段建立AC自动机,因为最多10个串,每个串最长为10,所以最多可能有100个节点,在长度为n时 以每个节点终止的健康字符串个数形成一个状态集,通过AC自动机形成的边可以推导出n+1的状态集,走到单词节点是 非法的,所以同样的我们可以先走到单词节点,但是从单词节点不向后转移.这样可以构造一个矩阵,剩下的就是矩阵 快速幂.注意的一

POJ - 2778 ~ HDU - 2243 AC自动机+矩阵快速幂

这两题属于AC自动机的第二种套路通过矩阵快速幂求方案数. 题意:给m个病毒字符串,问长度为n的DNA片段有多少种没有包含病毒串的. 根据AC自动机的tire图,我们可以获得一个可达矩阵. 关于这题的tire图详解可以点击这里,往下面翻,这个博主的图对于tire图讲的非常详细. 知道了什么是tire图,理解了tire图后,后面的AC自动机的题目才能写. AC自动机的灵魂应该就是tire图 然后问题就变成了,得到了一个可达矩阵后,如何求方案数呢? 这个n = 2000000000 这咋办呢? 给定一

POJ 2778 DNA Sequence (AC自动机,矩阵乘法)

题意:给定n个不能出现的模式串,给定一个长度m,要求长度为m的合法串有多少种. 思路:用AC自动机,利用AC自动机上的节点做矩阵乘法. 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<cmath> 5 #include<string> 6 #include<algorithm> 7 #include<queue> 8 #defin

Poj 2778 DNA Sequence (AC自动机+矩阵)

题目大意: 给出N个串,问在长度为L的所有串中,不包含任一已知串的个数有多少个. 思路分析: 已知一个矩阵A,A[i][j] 表示 节点i 到 节点 j 有一条变可以到达的方法数. 那么A^2 ,这个矩阵的 [i][j] 就代表这个节点 i 到节点 j 有两条边可以到达的方法数. 那么知道这个结论,我们要做的就是求一个节点到另外一个节点,要经过L条变(对应这长度为L的单词),而又要满足任意一条边都不能经过已知单词. 所以我们要用到ac自动机处理出所有已知的单词,在ac自动机上得到这个矩阵,使得任

[poj2778]DNA Sequence(AC自动机+矩阵快速幂)

解题关键:卡时限过的,正在找原因中. 1 #include<cstdio> 2 #include<cstring> 3 #include<algorithm> 4 #include<cstdlib> 5 #include<cstring> 6 #include<iostream> 7 #include<queue> 8 using namespace std; 9 typedef long long ll; 10 cons

poj2778DNA Sequence (AC自动机+矩阵快速幂)

转载请注明出处: http://www.cnblogs.com/fraud/          ——by fraud DNA Sequence Time Limit: 1000MS   Memory Limit: 65536K Description It's well known that DNA Sequence is a sequence only contains A, C, T and G, and it's very useful to analyze a segment of DN

poj 2778 AC自动机 + 矩阵快速幂

// poj 2778 AC自动机 + 矩阵快速幂 // // 题目链接: // // http://poj.org/problem?id=2778 // // 解题思路: // // 建立AC自动机,确定状态之间的关系,构造出,走一步 // 能到达的状态矩阵,然后进行n次乘法,就可以得到状态间 // 走n步的方法数. // 精髓: // 1):这个ac自动机有一些特别,根节点是为空串,然而 // 每走一步的时候,如果没法走了,这时候,不一定是回到根 // 节点,因为有可能单个的字符时病毒,这样

HDU 2243 考研路茫茫――单词情结 (AC自动机 + 矩阵快速幂)

题目链接:考研路茫茫――单词情结 做本题前,个人建议先做一下POJ 2778 http://blog.csdn.net/u013446688/article/details/47378255 POJ2778 是求长度为n,不包含模式串的字符串个数. 而本题是求长度为n,包含模式串的字符串个数.直接用字符串总数减去不包含模式串的字符串个数即为所求. 同样是AC自动机 + 矩阵快速幂.但是还是有所不同的. 因为对2^64取模,所以定义数据类型为unsigned long long就可以了,这样就实现

hdu 2243 AC自动机 + 矩阵快速幂

// hdu 2243 AC自动机 + 矩阵快速幂 // // 题目大意: // // 给你一些短串,问在长度不超过k的任意串,包含至少一个这些短串的其中 // 一个.问这样的串有多少个. // // 解题思路: // // 首先, 包含和不包含是一种互斥关系,包含+不包含 = 全集u.全集的答案就是 // 26 ^ 1 + 26 ^ 2 + .... + 26 ^ k.不包含的比较好求.构建一个自动机,得到 // 一个转移矩阵A.表示状态i能到状态j的方法数.而这些状态中都是不包含所给的 //