[后缀数组+dp/AC自动机+dp+线段树] hdu 4117 GRE Words

题意:

给你N个字符串, N(1 <= N <= 2w), 所有串的长度加一起不超过30w。每个串有个值。这个值[-1000, 1000].

问不打乱字符串顺序,从中取若干个字符串,使得前一个串是后一个串的子串,求满足前面调条件的字符串值得和最大,求这个值。

思路:

其实就是一个很明显的dp。

dp[i]代表以第i个字符串结尾的最大权值。

但是就是子串这个问题怎么处理。

由于这题数据比较水可以用后缀数组处理这个问题。

将所有字符串拼接,做sa。

每次在height数组里往上和往下寻找公共前缀等于这个大于等于这个串长的那些后缀所对应的是哪个字符串。

然后进行状态转移。

这题的正解应该是AC自动机+dp+线段树优化。

过段时间补全。

后缀数组+dp代码:

#include"stdio.h"
#include"algorithm"
#include"string.h"
#include"iostream"
#include"queue"
#include"map"
#include"vector"
#include"string"
#define N 340005
#define M 20005
using namespace std;
int v[N],sa[N],ra[N],height[N],id[N];
int wa[N],wb[N],wv[N],wws[N];
char fuck[N];
int value[M],mark[M],dp[M],len[M];
int cmp(int *r,int a,int b,int l)
{
    return r[a]==r[b]&&r[a+l]==r[b+l];
}
void da(int n,int m)
{
    int i,j,p,*x=wa,*y=wb;
    for(i=0; i<m; i++) wws[i]=0;
    for(i=0; i<n; i++) wws[x[i]=v[i]]++;
    for(i=1; i<m; i++) wws[i]+=wws[i-1];
    for(i=n-1; i>=0; i--) sa[--wws[x[i]]]=i;
    for(j=1,p=1; p<n; j*=2,m=p)
    {
        for(i=n-j,p=0; i<n; i++) y[p++]=i;
        for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
        for(i=0; i<n; i++) wv[i]=x[y[i]];
        for(i=0; i<m; i++) wws[i]=0;
        for(i=0; i<n; i++) wws[wv[i]]++;
        for(i=1; i<m; i++) wws[i]+=wws[i-1];
        for(i=n-1; i>=0; i--) sa[--wws[wv[i]]]=y[i];
        for(swap(x,y),p=1,i=1,x[sa[0]]=0; i<n; i++) x[sa[i]]=cmp(y,sa[i],sa[i-1],j)?p-1:p++;
    }
    return ;
}
void gethei(int n)
{
    int i,j,k=0;
    for(i=1; i<=n; i++) ra[sa[i]]=i;
    for(i=0; i<n; i++)
    {
        if(k) k--;
        j=sa[ra[i]-1];
        while(v[i+k]==v[j+k]) k++;
        height[ra[i]]=k;
    }
    return ;
}
int main()
{
    int t,cas=1;
    cin>>t;
    while(t--)
    {
        int n,cnt=0,s=0;
        scanf("%d",&n);
        for(int i=0;i<n;i++)
        {
            scanf("%s%d",fuck,&value[i]);
            dp[i]=value[i];
            len[i]=strlen(fuck);   //每个串长度
            mark[i]=s;             //对于每个串取rank[mark[i]] 就是从哪个开始的后缀
            s+=len[i]+1;
            for(int j=0;fuck[j];j++)
            {
                id[cnt]=i;         //每个后缀对应的是哪个串的
                v[cnt++]=fuck[j]-'a';
            }
            id[cnt]=i;
            v[cnt++]=i+55;
        }
        v[cnt]=0;
        da(cnt+1,30000);
        gethei(cnt);
        for(int i=0;i<n;i++)
        {
            int Min=N;
            for(int j=ra[mark[i]];j>0;j--)  //向上找
            {
                Min=min(Min,height[j]);
                if(Min<len[i]) break;
                int tep=id[sa[j-1]];
                if(tep>i) dp[tep]=max(dp[tep],dp[i]+value[tep]);
            }
            Min=N;
            for(int j=ra[mark[i]]+1;j<=cnt;j++)  //向下找
            {
                Min=min(Min,height[j]);
                if(Min<len[i]) break;
                int tep=id[sa[j]];
                if(tep>i) dp[tep]=max(dp[tep],dp[i]+value[tep]);
            }
        }
        int ans=0;
        for(int i=0;i<n;i++) ans=max(ans,dp[i]);
        printf("Case #%d: %d\n",cas++,ans);
    }
    return 0;
}
时间: 2024-08-04 17:42:30

[后缀数组+dp/AC自动机+dp+线段树] hdu 4117 GRE Words的相关文章

tyvj P1519 博彩游戏(AC自动机+DP滚动数组)

P1519 博彩游戏 背景 Bob最近迷上了一个博彩游戏…… 描述 这个游戏的规则是这样的:每花一块钱可以得到一个随机数R,花上N块钱就可以得到一个随机序列:有M个序列,如果某个序列是产生的随机序列的子串,那么就中奖了,否则不中.Bob会告诉你这M个序列,和身上有的钱的总数N,当然还有R的范围.请你告诉Bob中奖的概率有多少? 输入格式 第一行三个用空格隔开的数N.M和R的范围R.其中1<=R<=9,0<N<=60,0<M<=20000.下面M行每行一个字符串(长度小于

HDU3341 Lost&#39;s revenge(AC自动机+DP)

题目是给一个DNA重新排列使其包含最多的数论基因. 考虑到内存大概就只能这么表示状态: dp[i][A][C][G][T],表示包含各碱基个数为ACGT且当前后缀状态为自动机第i的结点的字符串最多的数论基因数 其中ACGT可以hash成一个整数(a*C*G*T+c*G*T+g*T+T),这样用二维数组就行了,而第二维最多也就11*11*11*11个. 接下来转移依然是我为人人型,我是丢进一个队列,用队列来更新状态的值. 这题果然挺卡常数的,只好手写队列,最后4500msAC,还是差点超时,代码也

HDU2296 Ring(AC自动机+DP)

题目是给几个带有价值的单词.而一个字符串的价值是 各单词在它里面出现次数*单词价值 的和,问长度不超过n的最大价值的字符串是什么? 依然是入门的AC自动机+DP题..不一样的是这题要输出具体方案,加个字符数组记录每个状态最优情况的字符串即可. 另外题目字典序是先考虑长度再考虑每一位单词:特别要注意,有一个非常坑的地方看了Disscus才知道——单词A包含单词B,那么只计算单词A不计算单词B. dp[i][j]表示长度i(自动机上转移k步)后缀状态是自动机第j个结点的字符串的最大价值 dp[0][

hdu 2457 AC自动机+dp

DNA repair Time Limit: 5000/2000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 2004    Accepted Submission(s): 1085 Problem Description Biologists finally invent techniques of repairing DNA that contains segments c

POJ1625 Censored!(AC自动机+DP)

题目问长度m不包含一些不文明单词的字符串有多少个. 依然是水水的AC自动机+DP..做完后发现居然和POJ2778是一道题,回过头来看都水水的... dp[i][j]表示长度i(在自动机转移i步)且后缀状态为自动机第j个结点的合法字符串数 dp[0][0]=1 转移转移... 注意要用高精度,因为答案最多5050. 还有就是要用unsigned char,题目的输入居然有拓展的ASCII码,编码128-255. 1 #include<cstdio> 2 #include<cstring&

HDU2457 DNA repair(AC自动机+DP)

题目一串DNA最少需要修改几个基因使其不包含一些致病DNA片段. 这道题应该是AC自动机+DP的入门题了,有POJ2778基础不难写出来. dp[i][j]表示原DNA前i位(在AC自动机上转移i步)且后缀状态为AC自动机结点j的最少需要修改的基因数 转移我为人人型,从dp[i][j]向ATCG四个方向转移到dp[i+1][j'],如果结点被标记包含致病基因就不能转移. 1 #include<cstdio> 2 #include<cstring> 3 #include<que

BZOJ 2434: [Noi2011]阿狸的打字机( AC自动机 + DFS序 + 树状数组 )

一个串a在b中出现, 那么a是b的某些前缀的后缀, 所以搞出AC自动机, 按fail反向建树, 然后查询(x, y)就是y的子树中有多少是x的前缀. 离线, 对AC自动机DFS一遍, 用dfs序+树状数组维护, DFS到的查询点就回答询问.时间复杂度O(|ACAM|+QlogQ) ------------------------------------------------------------------------------------------- #include<cstdio>

bzoj 1030 [JSOI2007]文本生成器(AC自动机+DP)

1030: [JSOI2007]文本生成器 Time Limit: 1 Sec  Memory Limit: 162 MBSubmit: 3059  Solved: 1255[Submit][Status][Discuss] Description JSOI交给队员ZYX一个任务,编制一个称之为“文本生成器”的电脑软件:该软件的使用者是一些低幼人群,他们现在使用的是GW文本生成器v6版.该软件可以随机生成一些文章―――总是生成一篇长度固定且完全随机的文章—— 也就是说,生成的文章中每个字节都是完

bzoj1030 [JSOI2007]文本生成器——AC自动机+DP

题目:https://www.lydsy.com/JudgeOnline/problem.php?id=1030 求至少有一个单词的文本串不太好求,所以转化成求所有情况减去没有一个单词的文本串: 没有一个单词的文本串可以用AC自动机+DP求,设 f[i][j] 表示文本串长度为 i ,当前 Trie 树上节点为 j 的方案数: 则 f[i][j] 可以转到仍然不包含单词的它的儿子的方案数中,同时文本串长度+1: 所以需要在 getfail 时把单词结尾的属性也转移一下,因为 fail 是单词结尾