[SCOI2012]喵星球上的点名——堪称九种方法做的题

题意:

给你N个串对,M个询问串,对每个询问串求是多少串对的子串(在串对的某一个中作为子串),以及每个串对最终是包含了多少询问串

方法众多。。

可谓字符串家族八仙过海各显神通。

复杂度不尽相同,O(nlogn),O(nsqrt(n)),O(玄学)(也就是暴力)

(数据比较水,所以一些暴力就过去了)

做法基本都是离线。

法一:AC自动机+暴力

对询问串建AC自动机,把主串往上跑。

匹配到了一个节点,就暴力跳fail,把沿途的点如果是询问串的结尾,ans++,并打上标记,防止重复计数。

一串1111111,随便卡。

法二:AC自动机+hash

询问串或者主串可能有相同的,,,hash一下,减少理论复杂度。。。

还是随便卡。

法三:AC自动机+fail树虚树

这个是正解O(nlogn)。

但是不会虚树,咕咕咕。

法四:后缀数组+hash

AC自动机比较辣鸡,后缀家族表示不服。

一个后缀的和询问串的lcp是询问串的长度的话,那么这个询问串就是子串。

考虑一个询问会被哪些后缀包含,我们把所有的询问串和子串用分隔符隔开,然后跑SA,HEIGHT

对于每个询问串的开头位置,往左往右二分出所有出现的位置。

这个区间[l,r]就是这个询问串的所有出现位置~!

luogu题解第一篇dalao说,可以不用二分,线性处理出l,r的位置。

然后我写了单调队列,,,,然鹅显然这个区间端点并没有单调性。。。然后WA了半天。。。。

不知是这个dalao口胡错了,还是我太菜了?

怎么统计答案?

由于区间长度期(shu)望(ju)不(tai)大(shui),可以暴力扫一遍这个区间,然后轻松统计答案。

一串111111,应该还是能卡。

法五:后缀数组+莫队

莫队教导我们:干嘛要直接暴力?

处理出询问区间之后,莫队可以轻松统计第一问,

第二问的话:差分。每新加入一个颜色,就把这个颜色的答案加上剩余询问的次数,删除这个颜色的时候,就把剩余次数减掉。这样,处理所有包含这个颜色的询问的时候,这些询问一定贡献到了这个颜色里。

O(nsqrt(n))

法六:后缀数组+树状数组

莫队归根到底,还是暴力啊。。。。

再看一看第一问是什么:统计区间颜色的数量?哦,,[SDOI2009]HH的项链!!

树状数组来也。

第二问呢?反过来,把询问当做树状数组中加入的点值。

到L的时候,bit(L)++,到R的时候,bit(L)--,到i的时候,ans+=query(i)-query(pre[i])

类似扫描线。

本质上还是对于每个颜色第一次被区间包含的时候,把这个区间的贡献加上。为什么这里要把bit(L)--?为了消除区间两端在中间的情况。

那为什么不把bit(R)--?这样前面的相同部分并不能减去

反而加上了-1

我写的就是这个方法:

注意:

1.还是二分吧。。

2.注意我们是在SA数组上操作,pos记录的是原串的所属,所以,在SA上循环的时候,查询这个后缀的所属,用pos[sa[i]]

#include<bits/stdc++.h>
#define il inline
#define reg register int
#define numb (ch^‘0‘)
using namespace std;
typedef long long ll;
il void rd(int &x){
    char ch;bool fl=false;
    while(!isdigit(ch=getchar()))(ch==‘-‘)&&(fl=true);
    for(x=numb;isdigit(ch=getchar());x=x*10+numb);
    (fl==true)&&(x=-x);
}
namespace Miracle{
const int N=4e5+5;
const int C=1e4+2;
int x[N],y[N],c[N],sa[N],hei[N],rk[N];
int n,m;
int s[N+233];
void SA(int n){
    int m=C+2;
    for(reg i=1;i<=n;++i) ++c[x[i]=s[i]];
    for(reg i=1;i<=m;++i) c[i]+=c[i-1];
    for(reg i=1;i<=n;++i) sa[c[x[i]]--]=i;
    for(reg k=1;k<=n;k<<=1){
        int num=0;
        for(reg i=n-k+1;i<=n;++i) y[++num]=i;
        for(reg i=1;i<=n;++i){
            if(sa[i]-k>=1) y[++num]=sa[i]-k;
        }
        for(reg i=1;i<=m;++i) c[i]=0;
        for(reg i=1;i<=n;++i) ++c[x[i]];
        for(reg i=1;i<=m;++i) c[i]+=c[i-1];
        for(reg i=n;i>=1;--i) sa[c[x[y[i]]]--]=y[i],y[i]=0;
        swap(x,y);
        num=1;
        x[sa[1]]=1;
        for(reg i=2;i<=n;++i){
            x[sa[i]]=((y[sa[i]]==y[sa[i-1]])&&(y[sa[i-1]+k]==y[sa[i]+k])?num:++num);
        }
        if(num==n) break;
        m=num;
    }
}
void HEI(int n){
    for(reg i=1;i<=n;++i) rk[sa[i]]=i;
    int k=0;
    for(reg i=1;i<=n;++i){
        if(k)--k;
        if(rk[i]==1) continue;
        int j=sa[rk[i]-1];
        while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) ++k;
        hei[rk[i]]=k;
    }
}
int pos[N],pre[N],las[N],id[N];
int nxt[N];
struct question{
    int L,R,id,ans;
    bool friend operator <(question a,question b){
        return a.L<b.L;
    }
}que[N];
struct node{
    int L,p,c;
    bool friend operator <(node a,node b){
        if(a.p!=b.p) return a.p<b.p;
        return a.c>b.c;
    }
}po[2*N];
int cnt;
int chang[N];
int f[N][20];
int lg[N];
int tot;
int query(int x,int y){
    if(x==y) return tot-x+1;
    if(x>y) swap(x,y);
    ++x;
    int len=lg[y-x+1];
//    cout<<" rmq "<<len<<" "<<f[x][len]<<" "<<f[y-(1<<len)+1][len]<<endl;
    int ret=min(f[x][len],f[y-(1<<len)+1][len]);
    return ret;
}
void prewrk(int n){
///    cout<<" nn "<<n<<endl;
    for(reg i=1;i<=n;++i) {
        f[i][0]=hei[i];
        lg[i]=(i>>(lg[i-1]+1))?lg[i-1]+1:lg[i-1];
    }
    for(reg j=1;j<=18;++j){
        for(reg i=1;i+(1<<j)-1<=n;++i){
            f[i][j]=min(f[i][j-1],f[i+(1<<(j-1))][j-1]);
            //cout<<" i j "<<i<<" "<<j<<" : "<<f[i][j]<<endl;
        }
    }

    for(reg i=1;i<=n;++i){
        if(pos[sa[i]]==0&&id[sa[i]]>0){
            int tmp=i;
            int l=1,r=i-1;

            que[id[sa[i]]].id=id[sa[i]];
            while(l<=r){
                int mid=(l+r)>>1;
                if(query(mid,i)>=chang[id[sa[i]]]) tmp=mid,r=mid-1;
                else l=mid+1;
            }
            que[id[sa[i]]].L=tmp;

            l=i+1,r=n;
            tmp=i;
            while(l<=r){
                int mid=(l+r)>>1;
                if(query(i,mid)>=chang[id[sa[i]]]) tmp=mid,l=mid+1;
                else r=mid-1;
            }
            que[id[sa[i]]].R=tmp;
        }
    }
}
int ans1[N];
int ans2[N];
struct arraytree{
    int f[N];
    void add(int x,int c){
        for(;x<=tot;x+=x&(-x)) f[x]+=c;
    }
    int query(int x){
        int ret=0;
        for(;x;x-=x&(-x)) ret+=f[x];
        return ret;
    }
}t;
int main(){
    rd(n);rd(m);
    int len,x;
    tot=0;
    for(reg i=1;i<=n;++i){
        rd(len);
        for(reg j=1;j<=len;++j){
            rd(x);
            s[++tot]=x;
            id[tot]=0;
            pos[tot]=i;
        }
        s[++tot]=C;//warning!!!
        pos[tot]=-1;//warning!! -1
        rd(len);
        for(reg j=1;j<=len;++j){
            rd(x);
            s[++tot]=x;
            id[tot]=0;
            pos[tot]=i;
        }
        s[++tot]=C;
        pos[tot]=-1;
    }
    for(reg i=1;i<=m;++i){
        rd(len);
        chang[i]=len;
        for(reg j=1;j<=len;++j){
            rd(x);
            s[++tot]=x;
            pos[tot]=0;
            if(j==1) id[tot]=i;
        }
        s[++tot]=C;
        pos[tot]=-1;
    }
    SA(tot);

    HEI(tot);

    prewrk(tot);

//    cout<<" after "<<endl;
//
    sort(que+1,que+m+1);
//
//    for(reg i=1;i<=tot;++i){
//        cout<<s[i]<<" ";
//    }cout<<endl<<endl;
////
//    for(reg i=1;i<=tot;++i){
//        cout<<pos[sa[i]]<<" ";
//    }cout<<endl<<endl;
////
//    for(reg i=1;i<=tot;++i){
//        cout<<id[sa[i]]<<" ";
//    }cout<<endl<<endl;
//    for(reg i=1;i<=tot;++i){
//        cout<<hei[i]<<" ";
//    }cout<<endl<<endl;

    for(reg i=1;i<=m;++i){
    //    cout<<que[i].L<<" "<<que[i].R<<" "<<que[i].id<<endl;
        po[++cnt].c=1;
        po[cnt].L=que[i].L,po[cnt].p=que[i].L;

        po[++cnt].c=-1;
        po[cnt].L=que[i].L,po[cnt].p=que[i].R;
    }
    sort(po+1,po+cnt+1);

    for(reg i=1;i<=tot;++i){
        if(pos[sa[i]]>0){
            pre[i]=las[pos[sa[i]]];
            las[pos[sa[i]]]=i;
        }
    }
    memset(las,0,sizeof las);
    for(reg i=tot;i>=1;--i){
        if(pos[sa[i]]>0){
            if(las[pos[sa[i]]])nxt[i]=las[pos[sa[i]]];
            else nxt[i]=tot+1;
            las[pos[sa[i]]]=i;
        }
    }
    int now=1;
    for(reg i=1;i<=n;++i){
        if(las[i]){
            //cout<<i<<" add fir "<<las[i]<<endl;
            t.add(las[i],1);
        }
    }
    for(reg i=1;i<=tot;++i){
        while(now<=m&&que[now].L==i){
            //<<que[now].id<<" : "<<que[now].R<<" "<<t.query(que[now].R)<<" "<<que[now].L<<" "<<t.query(que[now].L-1)<<endl;
            que[now].ans=t.query(que[now].R)-t.query(que[now].L-1);
            ans1[que[now].id]=que[now].ans;
            ++now;
        }
        if(nxt[i]&&nxt[i]<=tot) t.add(nxt[i],1);
    }
    memset(t.f,0,sizeof t.f);
    now=1;
    for(reg i=1;i<=tot;++i){
        while(po[now].p==i&&now<=cnt&&po[now].c==1){
            t.add(po[now].L,po[now].c);
            ++now;
        }
        if(pos[sa[i]]>0){
            ans2[pos[sa[i]]]+=t.query(i)-t.query(pre[i]);
        }
        while(po[now].p==i&&now<=cnt){
            t.add(po[now].L,po[now].c);
            ++now;
        }
    }
    for(reg i=1;i<=m;++i){
        printf("%d\n",ans1[i]);
    }
    for(reg i=1;i<=n;++i){
        printf("%d ",ans2[i]);
    }
    return 0;
}

}
signed main(){
    Miracle::main();
    return 0;
}

/*
   Author: *Miracle*
   Date: 2018/12/23 11:39:01
*/

法七:后缀数组+主席树+树状数组

emmm。。。

第一问也可以用主席树做。。。(虽然已经离线了,就完全没有必要了)

法八:后缀自动机+暴力

SAM大吼一声,怎么能少了俺?!?!

对所有的姓、名建广义SAM

可以对每个串的每个位置暴力跳parent树,把每个right集合的位置实际在多少个串上出现,叫做sz,记录下来。

询问的话,匹配一遍,如果中途没有失配,最后的匹配到节点的sz即为答案。

然后在这个点上打上tag++

最后,把所有的姓名串的每个位置再跑一遍,tag的总和就是被点名次数。当然,要在途中留下自己的标记,以防重复统计。

还是暴力。

一串111111应该还是可以卡掉?因为parent树退化成了一条链。

但是值得一提的是,这个算法总算是在线的!

法九:后缀自动机+莫队

思路来自:ywy_c_asm

莫队支持区间,那后缀自动机哪里有区间?

先把每个询问串在后缀自动机上跑一下,(失配直接puts0,然后滚蛋)

最后到了某个节点p,那么根据parent树的意义,p的子树中的所有点代表的位置都包含这个询问串!

于是,我们用莫队来搞dfn序!(具体所属情况,叶子就记录了。)

然后的方法大家就已经很熟悉了。(当然也可以用主席树或者树状数组做。)

原文地址:https://www.cnblogs.com/Miracevin/p/10165020.html

时间: 2024-10-11 01:53:37

[SCOI2012]喵星球上的点名——堪称九种方法做的题的相关文章

BZOJ 2754: [SCOI2012]喵星球上的点名 [后缀数组+暴力]

2754: [SCOI2012]喵星球上的点名 Time Limit: 20 Sec  Memory Limit: 128 MBSubmit: 1906  Solved: 839[Submit][Status][Discuss] Description a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣.   假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那

BZOJ 2754([SCOI2012]喵星球上的点名-后缀数组统计序列集合中子序列出现次数)

2754: [SCOI2012]喵星球上的点名 Time Limit: 20 Sec  Memory Limit: 128 MB Submit: 805  Solved: 380 [Submit][Status][Discuss] Description a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣.   假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,

BZOJ 2754: [SCOI2012]喵星球上的点名

2754: [SCOI2012]喵星球上的点名 Time Limit: 20 Sec  Memory Limit: 128 MBSubmit: 1926  Solved: 850[Submit][Status][Discuss] Description a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣. 假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么这

bzoj 2754 [SCOI2012]喵星球上的点名(后缀数组)

2754: [SCOI2012]喵星球上的点名 Time Limit: 20 Sec  Memory Limit: 128 MBSubmit: 1359  Solved: 618[Submit][Status][Discuss] Description a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣.   假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那

bzoj2754 [SCOI2012]喵星球上的点名 (后缀数组+树状数组)

2754: [SCOI2012]喵星球上的点名 Time Limit: 20 Sec Memory Limit: 128 MB Submit: 2745 Solved: 1190 [Submit][Status][Discuss] Description a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣. 假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么

P2336 [SCOI2012]喵星球上的点名(后缀自动机+莫队)

P2336 [SCOI2012]喵星球上的点名 #include<iostream> #include<cstdio> #include<cstring> #include<algorithm> #include<cmath> #include<map> #define rint register int using namespace std; int read(){ char c=getchar();int x=0; while(

洛谷 P2336 [SCOI2012]喵星球上的点名

题目描述 a180285 幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣. 假设课堂上有 N 个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M 个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么这个喵星人就必须答到. 然而,由于喵星人的字码过于古怪,以至于不能用 ASCII 码来表示.为了方便描述,a180285 决定用数串来表示喵星人的名字. 现在你能帮助 a180285 统计每次点名的时候有多少喵星人答到,以及 M 次点名结

[BZOJ2754] [SCOI2012]喵星球上的点名解题报告|后缀数组

a180285幸运地被选做了地球到喵星球的留学生.他发现喵星人在上课前的点名现象非常有趣.   假设课堂上有N个喵星人,每个喵星人的名字由姓和名构成.喵星球上的老师会选择M个串来点名,每次读出一个串的时候,如果这个串是一个喵星人的姓或名的子串,那么这个喵星人就必须答到. 然而,由于喵星人的字码过于古怪,以至于不能用ASCII码来表示.为了方便描述,a180285决定用数串来表示喵星人的名字. 现在你能帮助a180285统计每次点名的时候有多少喵星人答到,以及M次点名结束后每个喵星人答到多少次吗?

BZOJ 2754 SCOI2012 喵星球上的点名 fail树+set启发式合并

题目大意:给定n个目标串和m个模式串,问这m个模式串每个在多少个目标串中出现过,以及n个目标串每个以最多多少个模式串为子串 我错了--就算用fail树+set启发式合并也优化不到O(nlog^2n)--这题的数据范围相当无解啊 首先将所有名字和点名的字符串全都插进AC自动机 将每个点上开一个set记录这个点是哪些喵星人的名字的前缀 然后建立fail树 沿着fail树从下到上启发式合并 每合并完一个点 如果这个点是某次点名的字符串 那么这次点名点到的喵星人就是这个点的set中的所有元素 统计答案即