hdu 4416 Good Article Good sentence (后缀数组)

题目大意:

给出一个A串和很多个B串,求出A中有多少个子串,是所有的B中没有出现的。

思路分析:

后缀数组的作用很容易的求出来整个串中不同的子串个数。

现在要求的是A中不同的,且在B中没有出现过的。

先把AB 串全部连接,跑一遍suffix array。然后求出有多少个不同的子串。

然后再单独用B 串跑 suffix array。再求出单独在B 中有多少个不同的 子串。

然后结果就是 ans1 - ans2 ...

需要注意的问题就是,连接的时候需要把每一个串后面加一个特殊符。但是求不同串的时候是不能算进去的。

所以要进行一些判断。

#include <cstdio>
#include <iostream>
#include <cstring>
#include <algorithm>
#include <vector>
#define lson num<<1,s,mid
#define rson num<<1|1,mid+1,e
#define maxn 311005
#define inf 0x3f3f3f3f
using namespace std;
typedef long long ll;

int str[maxn<<1];
int sa[maxn],t1[maxn],t2[maxn],c[maxn];
void suffix(int n,int m)
{
    int *x=t1,*y=t2;
    for(int i=0; i<m; i++)c[i]=0;
    for(int i=0; i<n; i++)c[x[i]=str[i]]++;
    for(int i=1; i<m; i++)c[i]+=c[i-1];
    for(int i=n-1; i>=0; i--)sa[--c[x[i]]]=i;
    for(int k=1; k<=n; k<<=1)
    {
        int p=0;
        for(int i=n-k; i<n; i++)y[p++]=i;
        for(int i=0; i<n; i++)if(sa[i]>=k)y[p++]=sa[i]-k;
        for(int i=0; i<m; i++)c[i]=0;
        for(int i=0; i<n; i++)c[x[y[i]]]++;
        for(int i=0; i<m; i++)c[i]+=c[i-1];
        for(int i=n-1; i>=0; i--)sa[--c[x[y[i]]]]=y[i];
        swap(x,y);
        p=1;
        x[sa[0]]=0;
        for(int i=1; i<n; i++)
            x[sa[i]]=y[sa[i-1]]==y[sa[i]]&&y[sa[i-1]+k]==y[sa[i]+k]?p-1:p++;
        if(p>=n)break;
        m=p;
    }
}
int rank[maxn],height[maxn];
void getheight(int n)
{
    int k=0;
    for(int i=0; i<n; i++)rank[sa[i]]=i;
    for(int i=0; i<n; i++)
    {
        if(k)k--;
        if(!rank[i])continue;
        int j=sa[rank[i]-1];
        while(str[i+k]==str[j+k])k++;
        height[rank[i]]=k;
    }
}

char tmp[maxn];
int dex[maxn];
int len[maxn];
int main()
{
    int T,CASE=1;
    scanf("%d",&T);
    int tp;
    while(T--)
    {
        memset(dex,0x3f,sizeof dex);
        memset(len,0,sizeof len);
        tp=0;

        int N;
        scanf("%d",&N);

        scanf("%s",tmp);

        len[1] = strlen(tmp);

        for(int j=0;j<len[1];j++)
        {
            dex[tp]=1;
            str[tp++]=tmp[j];
        }

        str[tp++]=1+128;

        for(int i=2;i<=N+1;i++)
        {
            scanf("%s",tmp);
            len[i]=strlen(tmp);
            for(int j=0;j<len[i];j++)
            {
                dex[tp]=i;
                str[tp++]=tmp[j];
            }
            str[tp++]=i+128;
            len[i]=tp-1;
        }

        str[tp-1]=0;
        suffix(tp,N+200);
        getheight(tp);//对AB串进行处理

        ll ans=0;

        for(int i=1;i<tp;i++)
        {
            if(dex[sa[i]]!=inf)
                ans+=len[dex[sa[i]]]-sa[i]-height[i];
        }

        for(int i=len[1]+1;i<tp;i++)
        {
            str[i-len[1]-1]=str[i];
            dex[i-len[1]-1]=dex[i];
        }

        for(int i=2;i<=N+1;i++)
            len[i]-=len[1]+1;

        tp-=len[1]+1;

        suffix(tp,N+200);
        getheight(tp);//对B串单独进行处理
        ll tans = 0;
        for(int i=1;i<tp;i++)
        {
                if(dex[sa[i]]!=inf)
                tans+=len[dex[sa[i]]]-sa[i]-height[i];
        }

        printf("Case %d: %I64d\n",CASE++,ans-tans);
    }
    return 0;
}

hdu 4416 Good Article Good sentence (后缀数组),布布扣,bubuko.com

时间: 2024-10-12 07:18:36

hdu 4416 Good Article Good sentence (后缀数组)的相关文章

hdu 4416 Good Article Good sentence(后缀数组&amp;思维)

Good Article Good sentence Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 2308    Accepted Submission(s): 649 Problem Description In middle school, teachers used to encourage us to pick up pre

hdu 4416 Good Article Good sentence(后缀自动机)

题目链接:hdu 4416 Good Article Good sentence 题意: 给你一个串A和n个串B,问你A有多少个子串不是这n个B的子串. 题解: 将A串建立后缀自动机,对于每个B串都拿去匹配一下,并记录后缀自动机中每个节点的最大匹配长度. 然后拓扑排序,更新每个节点的fail节点.最后对于每个节点的贡献就是ml[i]-max(is[i],mx[f[i]]) (is[i]是该节点的最大匹配长度) 1 #include<bits/stdc++.h> 2 #define F(i,a,

[hdu 4416]Good Article Good sentence

最近几天一直在做有关后缀自动机的题目 感觉似乎对后缀自动机越来越了解了呢!喵~ 这题还是让我受益颇多的,首先搞一个后缀自动机是妥妥的了 可是搞完之后呢? 我们来观察 step 这个变量,每个节点的 step 是从根节点到此节点所经过的最长步数 那么也就是以该点为结尾的最长的后缀长度 如何统计不被 Bi 串包含的子串呢? 其实很简单,维护每个节点所能匹配的最长的字符串长度 然后 节点->step-max(该节点所能匹配的最长的字符串长度, 节点->fail->step) 就是答案了 因为

HDU 4416 Good Article Good sentence(后缀自动机)

[题目链接] http://acm.hdu.edu.cn/showproblem.php?pid=4416 [题目大意] 给出一个字符串,然后,给出一个字符串集合,问在该字符串中出现,且不在字符串集合中出现的子串总数. [题解] 将集合中所有的子串在自动机上跑,保存匹配到的位置的最长匹配, 用于在parent树上计算每个位置的最长匹配,对于一个位置, 如果不存在匹配,那么他对答案的贡献就是其value值, 如果存在匹配且匹配长度小于其长度那么取其差作为答案的贡献.最后输出即可. [代码] #in

HDU 1403 Longest Common Substring(后缀数组,最长公共子串)

hdu题目 poj题目 参考了 罗穗骞的论文<后缀数组——处理字符串的有力工具> 题意:求两个序列的最长公共子串 思路:后缀数组经典题目之一(模版题) //后缀数组sa:将s的n个后缀从小到大排序后将 排序后的后缀的开头位置 顺次放入sa中,则sa[i]储存的是排第i大的后缀的开头位置.简单的记忆就是“排第几的是谁”. //名次数组rank:rank[i]保存的是suffix(i){后缀}在所有后缀中从小到大排列的名次.则 若 sa[i]=j,则 rank[j]=i.简单的记忆就是“你排第几”

hdu 4691 最长公共前缀 后缀数组 +lcp+rmq

http://acm.hdu.edu.cn/showproblem.php?pid=4691 去年暑假多校赛的题,当时还不会后缀数组 现在会了,其实自己组合后缀数组跟rmq还是对的,但是题意理解有问题,于是折腾了很久,,,, 此处简单解释下题目样例吧,希望对读者有帮助  以最后一组数据为例 myxophytamyxopodnabnabbednabbingnabit 6 0 9 9 16 16 19 19 25 25 32 32 37 前两行不解释,题目叙述很清楚 从第三行,0 9 指的是第一个字

Hdu 5030 Rabbit&#39;s String (后缀数组)

题目大意: 要求将一个长串分解成最多k个子串,使得分开的n个串的字典序最大的那一个子串的字典序最小. 思路分析: 要最大的最小,不难想到二分的. 我们二分出原串中的第rk大子串就是目标串. 现在就是怎么判断这个串满足要求,也就是我们如何分其他部分,使之成为字典序最大的一个. 我们可以通过rk轻易的找到这是哪一个串,假设它处在sa[t]中. 那么可以知道 在 sa数组中t以前的子串的字典序都是比目标串小的. 而后面会有比sa大的,我们就要分解这些串. 我们从t 扫描 到n的height  ,如果有

HDOJ 题目4416 Good Article Good sentence(后缀数组求a串子串在b串中不出现的种类数)

-每周六晚的BestCoder(有米!) Good Article Good sentence Time Limit: 6000/3000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 2784    Accepted Submission(s): 785 Problem Description In middle school, teachers used to encour

HDOJ 4416 Good Article Good sentence

题解转自:http://blog.csdn.net/dyx404514/article/details/8807440 2012杭州网络赛的一道题,后缀数组后缀自己主动机都行吧. 题目大意:给一个字符串S和一系列字符串T1~Tn,问在S中有多少个不同子串满足它不是T1~Tn中随意一个字符串的子串. 思路:我们先构造S的后缀自己主动机,然后将每个Ti在S的SAM上做匹配,类似于LCS,在S中的每个状态记录一个变量deep,表示T1~Tn,在该状态能匹配的最大长度是多少,将每个Ti匹配完之后,我们将