例题3.15 子串 UVa11468

1.题目描述:点击打开链接

2.解题思路:本题利用概率dp+AC自动机解决。首先,把所有的模板串加入到Trie,然后标记所有单词结点,然后每次随机生成一个字符,就相当于在AC自动机中随机走一步,而且只允许走不被标记的结点。令d(u,L)表示当前在结点i,还需要走L步,不进入任何禁止结点的概率。那么不难由全概率公式得到下式:

d(u,L)=sum{P[v]*d(v,L-1)|v是一个没有被禁止的结点};

这样,最终的答案就是d(0,L)。

3.代码:

#include<iostream>
#include<algorithm>
#include<cassert>
#include<string>
#include<sstream>
#include<set>
#include<bitset>
#include<vector>
#include<stack>
#include<map>
#include<queue>
#include<deque>
#include<cstdlib>
#include<cstdio>
#include<cstring>
#include<cmath>
#include<ctime>
#include<cctype>
#include<functional>
#pragma comment(linker, "/STACK:1024000000,1024000000")
using namespace std;

#define me(s)  memset(s,0,sizeof(s))
#define rep(i,n) for(int i=0;i<(n);i++)
typedef long long ll;
typedef unsigned int uint;
typedef unsigned long long ull;
//typedef pair <int, int> P;

const int sigma_size=64;
const int maxnode=500;
const int maxs=20+10;

int idx[256],n;
double prob[sigma_size];

struct AhoCorasickAutomata
{
    int ch[maxnode][sigma_size];
    int f[maxnode];
    int match[maxnode];//match[i]表示结点i是否为一个单词结点
    int sz;

    void init()
    {
        sz=1;
        me(ch[0]);
    }

    void insert(char*s)
    {
        int u=0,n=strlen(s);
        for(int i=0;i<n;i++)
        {
            int c=idx[s[i]];
            if(!ch[u][c])
            {
                me(ch[sz]);
                match[sz]=0;
                ch[u][c]=sz++;
            }
            u=ch[u][c];
        }
        match[u]=1;
    }

    void getFail()
    {
        queue<int>q;
        f[0]=0;
        for(int c=0;c<sigma_size;c++)
        {
            int u=ch[0][c];
            if(u){f[u]=0;q.push(u);}
        }
        while(!q.empty())
        {
            int r=q.front();q.pop();
            for(int c=0;c<sigma_size;c++)
            {
                int u=ch[r][c];
                if(!u){ch[r][c]=ch[f[r]][c];continue;}
                q.push(u);
                int v=f[r];
                while(v&&!ch[v][c])v=f[v];
                f[u]=ch[v][c];
                match[u]|=match[f[u]];//如果f[u]也是一个单词结点,那么需要标记上u,该语句相当于省略了last
            }
        }
    }

    void dump()
    {
        printf("sz=%d\n",sz);
        for(int i=0;i<sz;i++)
            printf("%d: %d %d %d\n",i,ch[i][0],ch[i][1],match[i]);
        printf("\n");
    }
};

AhoCorasickAutomata ac;

double d[maxnode][105];
int vis[maxnode][105];
double getProb(int u,int L)
{
    if(!L)return 1.0;
    if(vis[u][L])return d[u][L];
    vis[u][L]=1;
    double&ans=d[u][L];
    ans=0.0;
    for(int i=0;i<n;i++)
        if(!ac.match[ac.ch[u][i]])//不走任何单词结点
        ans+=prob[i]*getProb(ac.ch[u][i],L-1);
    return ans;
}

char s[30][30];

int main()
{
    int T;
    scanf("%d",&T);
    for(int kase=1;kase<=T;kase++)
    {
        int k,L;
        scanf("%d",&k);
        for(int i=0;i<k;i++)
            scanf("%s",s[i]);
        scanf("%d",&n);
        for(int i=0;i<n;i++)
        {
            char ch[9];
            scanf("%s%lf",ch,&prob[i]);
            idx[ch[0]]=i;
        }
        ac.init();
        for(int i=0;i<k;i++)
            ac.insert(s[i]);
        ac.getFail();
        scanf("%d",&L);
        me(vis);
        printf("Case #%d: %.6lf\n",kase,getProb(0,L));
    }
}

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-27 20:08:43

例题3.15 子串 UVa11468的相关文章

java例题_49 计算子串出现的次数

1 /*49 [程序 49 子串出现的个数] 2 题目:计算字符串中子串出现的次数 3 */ 4 5 /*分析 6 * 1.子串的出现是有标志的,如" ",*,#或者其他 7 * 2.统计子串的出现的次数只需要抓住关键标志 8 * 3.怎么判断关键字一定是子串,一个子串可能有多个关键字 9 * */ 10 /*====================两种方法==================== 11 * 方法一:使用String类的substring(indexStart,inde

例题1.15 网络 UVALive 3902

1.题目描述:点击打开链接 2.解题思路:本题要求放置尽可能少的服务器,使得所有的客户端到最近的服务器的距离都不超过k.由于已经放置了一个服务器,不妨把它当做根结点,先把无根树转化为有根树,然后我们考虑最深的叶子,那么不难证明,该叶子结点的最优服务器的放置位置是它的k级祖先.这样本题的算法便不难想出:从最深的叶子开始枚举,并在它的k级祖先处放置一个服务器,同时标记该服务器能覆盖到的所有结点,这样当所有的叶子都被覆盖到时,服务器数量就是最少的.只用枚举到第k+1层叶子即可停止,因为小于等于k的叶子

训练指南DP阶段训练1

最近又忙又颓.............时间抓不紧....下学期开始就要准备考研了.......就2个月左右可以做自己喜欢的事了....争取把紫书和白书没做的,做过的..来一次完整的总结 训练指南上面的5个例题+后面15个习题是第一阶段 vjudge训练地址 http://vjudge.net/contest/139533#overview -------------------------------------------------------------------------------

C/C++算法竞赛入门经典Page11 例题1-5 三整数排序

题目:输入3个整数,从小到大排序后输出 样例输入: 20 7 33 样例输出: 7 20 33 首先,先声明三个整数a,b,c和一个临时变量t: int a,b,c,t;//1,b,c为三个整数,t为临时变量 输入三个整数: scanf("%d%d%d",&a,&b,&c); 进行3次if判断: 1.如果b>a,则a,b对调 2.如果c>a,则a,c对调 3.如果c>b,则b,c对调 代码: if(b>=a){ t=b; b=a; a=t

[Poj3261] [Bzoj1717] [后缀数组论文例题,USACO 2006 December Gold] Milk Patterns [后缀数组可重叠的k次最长重复子串]

和上一题(POJ1743,上一篇博客)相似,只是二分的判断条件是:是否存在一段后缀的个数不小于k 1 #include <iostream> 2 #include <algorithm> 3 #include <cstdio> 4 #include <cstdlib> 5 #include <cstring> 6 #include <cmath> 7 #include <ctime> 8 #include <map&

5月15日(链串中截取子串和BF算法)

BF算法属于一种蛮力算法,用来查找子串在串中的位置. // 截取子串 int getsstring(linkstr *s,char ch[],int k,int n){ linkstr *sl; sl = s; if(k<0 || n<0) return -1; for(int i = 0; i<k ;i++){ sl = sl->next; } for(int j; j<n; j++){ ch[j] = sl->ch; sl = sl->next; } retu

例题3.14 出现次数最多的子串 LA4670

1.题目描述:点击打开链接 2.解题思路:本题利用AC自动机解决.本题给的文本串非常长,但是模板串又多而短,正好适合AC自动机.然而一个问题是如何统计出现的次数.这里直接在print函数中递归统计.<训练指南>上说因为有重复的模板,需要用一个map来索引,但是本题由于已经把所有的模板保存到P数组了,没有这个索引也可以做. 3.代码: #include<iostream> #include<algorithm> #include<cassert> #inclu

《算法竞赛入门经典》3.3最长回文子串

1 //例题3-4 2 /* 3 * 输入一个字符串,求出其中最长的回文子串.子串的含义是:在原串中连续出现的字符串片段. 4 *回文的含义是:正看着和倒看着相同,如abba和yyxyy.在判断时,应该忽略所有标点符号和空格 5 *且忽略大小写,但输出应保持原样(在回文串的首部和尾部不要输出多余字符).输入字符长度不超过5000 6 *且占据单独的一行.应该输出最长回文串,如果有多个,输出起始位置最靠左的. 7 *样例输入:Confuciuss say:Madam,I'm Adam. 8 *样例

回文树或者回文自动机,及相关例题

回文树简述 在大部分说法中,回文树与回文自动机指的是一个东西: 回文树是对一个字符串,基于自动机思想构建的处理回文问题的树形结构: 回文树是对着一个单串建立的: 于是他主要用于计数(回文子串种类及个数) 基本建立思路是先建立其前缀的回文树,然后每加上一个字符,统计影响: 回文树存在fail指针但一般不承接字符串匹配问题: (回文树大概可以判定一个回文串是不是一个串的子串,但KMP之类的可以做得更好) 构建好的回文树,是这样的: (好难看) 可看出: 存在两个树结构,分别记录奇数|偶数长度的回文: