POJ 2778 DNA Sequence

DNA Sequence

Time Limit: 1000ms

Memory Limit: 65536KB

This problem will be judged on PKU. Original ID: 2778
64-bit integer IO format: %lld      Java class name: Main

It‘s well known that DNA Sequence is a sequence only contains A, C, T and G, and it‘s very useful to analyze a segment of DNA Sequence,For example, if a animal‘s DNA sequence contains segment ATC then it may mean that the animal may have a genetic disease. Until now scientists have found several those segments, the problem is how many kinds of DNA sequences of a species don‘t contain those segments.

Suppose that DNA sequences of a species is a sequence that consist of A, C, T and G,and the length of sequences is a given integer n.

Input

First line contains two integer m (0 <= m <= 10), n (1 <= n <=2000000000). Here, m is the number of genetic disease segment, and n is the length of sequences.

Next m lines each line contain a DNA genetic disease segment, and length of these segments is not larger than 10.

Output

An integer, the number of DNA sequences, mod 100000.

Sample Input

4 3
AT
AC
AG
AA

Sample Output

36

Source

POJ Monthly--2006.03.26

解题:真TMD的卡时间,奶奶个熊

  1 #include <iostream>
  2 #include <stdio.h>
  3 #include <cstring>
  4 #include <queue>
  5 using namespace std;
  6 typedef long long LL;
  7 const int mod = 100000;
  8 const int maxn = 80;
  9 int id[256];
 10 struct Matrix{
 11     int n,m[maxn][maxn];
 12     void init(int sz){
 13         n = sz;
 14         memset(m,0,sizeof m);
 15     }
 16     Matrix(int sz){
 17         init(sz);
 18     }
 19     void setOne(){
 20         for(int i = 0; i < n; ++i) m[i][i] = 1;
 21     }
 22     Matrix operator*(const Matrix &rhs){
 23         Matrix ret(n);
 24         for(int k = 0; k < n; ++k)
 25             for(int i = 0; i < n; ++i)
 26                 for(int j = 0; j < n; ++j)
 27                     ret.m[i][j] = (ret.m[i][j] + (LL)m[i][k]*rhs.m[k][j]%mod)%mod;
 28         return ret;
 29     }
 30     void out(){
 31         for(int i = 0; i < n; ++i){
 32             for(int j = 0; j < n; ++j)
 33                 cout<<m[i][j]<<" ";
 34             cout<<endl;
 35         }
 36     }
 37 };
 38 void quickPow(Matrix &base,Matrix &ret,int index){
 39     ret.setOne();
 40     while(index){
 41         if(index&1) ret = ret*base;
 42         index >>= 1;
 43         base = base*base;
 44     }
 45 }
 46 struct Trie{
 47     int ch[maxn][4],fail[maxn],cnt[maxn],tot;
 48     void init(){
 49         tot = 0;
 50         newnode();
 51     }
 52     int newnode(){
 53         memset(ch[tot],0,sizeof ch[tot]);
 54         fail[tot] = cnt[tot] = 0;
 55         return tot++;
 56     }
 57     void insert(char *str,int root = 0){
 58         for(int i = 0; str[i]; ++i){
 59             int &x = ch[root][id[str[i]]];
 60             if(!x) x = newnode();
 61             root = x;
 62         }
 63         ++cnt[root];
 64     }
 65     void build(int root = 0){
 66         queue<int>q;
 67         for(int i = 0; i < 4; ++i)
 68             if(ch[root][i]) q.push(ch[root][i]);
 69         while(!q.empty()){
 70             root = q.front();
 71             q.pop();
 72             cnt[root] += cnt[fail[root]];
 73             for(int i = 0; i < 4; ++i){
 74                 int &x = ch[root][i];
 75                 if(x){
 76                     fail[x] = ch[fail[root]][i];
 77                     q.push(x);
 78                 }else x = ch[fail[root]][i];
 79             }
 80         }
 81     }
 82     int solve(int m){
 83         Matrix a(tot),b(tot);
 84         for(int i = 0; i < tot; ++i){
 85             if(cnt[i]) continue;
 86             for(int j = 0; j < 4; ++j){
 87                 int x = ch[i][j];
 88                 if(cnt[x]) continue;
 89                 ++a.m[i][x];
 90             }
 91         }
 92         quickPow(a,b,m);
 93         int ret = 0;
 94         for(int i = 0; i < tot; ++i)
 95             ret = (ret + b.m[0][i])%mod;
 96         return ret;
 97     }
 98 }ac;
 99 int main(){
100     for(int i = 0; i < 4; ++i) id["ATCG"[i]] = i;
101     char str[maxn];
102     int n,m;
103     while(~scanf("%d%d",&n,&m)){
104         ac.init();
105         for(int i = 0; i < n; ++i){
106             scanf("%s",str);
107             ac.insert(str);
108         }
109         ac.build();
110         printf("%d\n",ac.solve(m));
111     }
112     return 0;
113 }

时间: 2024-10-09 21:48:17

POJ 2778 DNA Sequence的相关文章

poj 2778 DNA Sequence(AC自动机+矩阵快速幂)

题目链接:poj 2778 DNA Sequence 题目大意:给定一些含有疾病的DNA序列,现在给定DNA长度,问有多少种不同的DNA序列是健康的. 解题思路:对DNA片段建立AC自动机,因为最多10个串,每个串最长为10,所以最多可能有100个节点,在长度为n时 以每个节点终止的健康字符串个数形成一个状态集,通过AC自动机形成的边可以推导出n+1的状态集,走到单词节点是 非法的,所以同样的我们可以先走到单词节点,但是从单词节点不向后转移.这样可以构造一个矩阵,剩下的就是矩阵 快速幂.注意的一

POJ POJ 2778 DNA Sequence AC自动机 + 矩阵快速幂

首先建立Trie和失败指针,然后你会发现对于每个节点 i 匹配AGCT时只有以下几种情况: i 节点有关于当前字符的儿子节点 j 且安全,则i 到 j找到一条长度为 1的路. i 节点有关于当前字符的儿子节点 j 且 不安全,则i 到 j没有路. i 节点没有关于当前字符的儿子节点 但是能通过失败指针找到一个安全的节点j,那么 i 到 j 找到一条长度为1的路. 关于节点安全的定义: 当前节点不是末节点且当前节点由失败指针指回跟节点的路径上不存在不安全节点,那么这个节点就是安全节点. 然后问题就

POJ 2778 DNA Sequence (AC自动机 + 矩阵快速幂)

题目链接:DNA Sequence 解析:AC自动机 + 矩阵加速(快速幂). 这个时候AC自动机 的一种状态转移图的思路就很透彻了,AC自动机就是可以确定状态的转移. AC代码: #include <iostream> #include <cstdio> #include <queue> #include <cstring> using namespace std; const int MOD = 100000; struct Matrix{ int ma

线性代数(矩阵乘法):POJ 2778 DNA Sequence

DNA Sequence Description It's well known that DNA Sequence is a sequence only contains A, C, T and G, and it's very useful to analyze a segment of DNA Sequence,For example, if a animal's DNA sequence contains segment ATC then it may mean that the ani

POJ 2778 DNA Sequence(AC自动机+矩阵快速幂)

题目链接:http://poj.org/problem?id=2778 题意:有m种DNA序列是有疾病的,问有多少种长度为n的DNA序列不包含任何一种有疾病的DNA序列.(仅含A,T,C,G四个字符) 思路:Trie图的状态转移,用矩阵mat[i][j]来表示从结点i到j只走一步有几种走法,那么mat的n次幂就表示从结点i到j走n步有几种走法,题目要求解的就是从头节点走n步且不包含危险结点的走法. mat = mat^n   ans = (mat[0][0] + mat[0][1] + ...

POJ 2778 DNA Sequence(AC自动机+矩阵)

[题目链接] http://poj.org/problem?id=2778 [题目大意] 给出一些字符串,求不包含这些字符串的长度为n的字符串的数量 [题解] 我们将所有串插入自动机计算match,对于自动机上所有节点构建转移矩阵, 对于得到的可达矩阵我们求n长路的数量,统计0到各个点的n长路之和就是答案. [代码] #include <cstdio> #include <cstring> using namespace std; const int N=110; typedef

POJ 2778 DNA Sequence(AC自动机确定DFA转移图+矩阵快速幂)

这道题极好的展示了AC自动机在构造转移图DFA上的应用 DFA转移图就是展示状态的转移过程的图,DFA图构造出来后就可以用DP求出任何DNA长度下,任何状态的个数 本题用自动机求出DFA矩阵,那么有 | dp[n][0] dp[n][1] ... dp[n][m] |=|dp[1][0] dp[1][1] ... dp[1][m] | * DFA^(n-1)    (m指状态总数) DP边界矩阵|dp[1][0] dp[1][1] ... dp[1][m] | 也就是DFA的第一行,所以dp[n

POJ 2778 DNA Sequence —— (AC自动机+矩阵快速幂)

距离上次做AC自动机有很久了=.=,以前这题的思路死活看不懂,现在还是觉得很好理解的. 思路参见:http://blog.csdn.net/morgan_xww/article/details/7834801#. 我用cnt=1表示这个节点是危险的,然后再匹配fail指针的时候,如果一个节点的前缀是危险的,那么这个节点也是危险的,这么维护即可. 顺便一提,我以前的AC自动机模板是没有build过程中失配时的nxt指针的(以前是在match的过程中体现),但是失败时候需要的nxt指针又是很好用的,

POJ 2778 DNA Sequence (AC自动机,矩阵乘法)

题意:给定n个不能出现的模式串,给定一个长度m,要求长度为m的合法串有多少种. 思路:用AC自动机,利用AC自动机上的节点做矩阵乘法. 1 #include<iostream> 2 #include<cstdio> 3 #include<cstring> 4 #include<cmath> 5 #include<string> 6 #include<algorithm> 7 #include<queue> 8 #defin