[模板]后缀自动机

传送门

Description

给定一个只包含小写字母的字符串\(S\),

请你求出 \(S\) 的所有出现次数不为 \(1\) 的子串的出现次数乘上该子串长度的最大值。

Solution

保持好习惯吧,模板题还是放一下

SAM的板子,想必是到处都有,反正都比我写的好看。。。

当初想学SAM的时候,就被某俄文翻译的\(20000\)字论文吓跑了。。。

核心?

  • 作为一种可以表示所有后缀的状态的自动机,它得满足状态数尽可能的小
  • SAM的做法:
    1. 每个状态表示所有\(Right\)集合相同的子串,这里\(Right\)集合的定义可是一个子串在原串中所有出现位置的右端点的集合。
    2. 对于每个状态,我们定义一个\(step\),表示该状态所能表示的所有子串中长度最大值
    3. \(fa\)指针,满足当前串的\(Right\)集合是\(fa\)指向的状态的真子集,且是最大的那一个,可以发现,\(fa\)指针所指向的状态一定是当前状态子串的一个后缀。
    4. 在线加点,每次加点后最多只会增加两个新的状态

Code?

#include<bits/stdc++.h>
#define ll long long
#define max(a,b) ((a)>(b)?(a):(b))
#define min(a,b) ((a)<(b)?(a):(b))
class Suf_Automation
{
    #define MX 2000005
    private:
        int c[MX][26],fa[MX],step[MX],v[MX],rk[MX],val[MX];
        int last,cnt,n;
        ll ans=0;
    public:
        inline void init(int len)
        {
            cnt=last=1;n=len;
            for(int i=1;i<=n<<1;++i)
            memset(c[i],0,sizeof c[i]),step[i]=fa[i]=v[i]=val[i]=0;
        }
        void Insert(int x)
        {
            int p=last,np=++cnt;step[np]=step[p]+1;val[np]=1;
            for(;p&&!c[p][x];p=fa[p]) c[p][x]=np;
            if(!p) fa[np]=1;
            else
            {
                int q=c[p][x];
                if(step[q]==step[p]+1) fa[np]=q;
                else
                {
                    int nq=++cnt;step[nq]=step[p]+1;
                    memcpy(c[nq],c[q],sizeof c[q]);
                    fa[nq]=fa[q];fa[np]=fa[q]=nq;
                    for(;c[p][x]==q;p=fa[p]) c[p][x]=nq;
                }
            }
            last=np;
        }
        inline void Query()
        {
            register int i;
            for(i=1;i<=cnt;++i) ++v[step[i]];
            for(i=1;i<=n;++i) v[i]+=v[i-1];
            for(i=1;i<=cnt;++i) rk[v[step[i]]--]=i;
            for(i=cnt;i;--i)
            {
                val[fa[rk[i]]]+=val[rk[i]];
                if(val[rk[i]]>1) ans=max(ans,1ll*val[rk[i]]*step[rk[i]]);
            }
            val[1]=0;
            printf("%lld\n",ans);
        }
    #undef MX
}pac;
#define MN 1000005
char s[MN];
int main()
{
    scanf("%s",s+1);
    register int i,n=strlen(s+1);
    pac.init(n);
    for(i=1;i<=n;++i) pac.Insert(s[i]-'a');
    pac.Query();
    return 0;
}

SAM的作用?

很好的维护子串信息的工具嘛。

下面附上一个简单的,查询某个串的出现次数?

int Calc(char*s,int l,int r)
{
    int x=1;
    for(int i=l;i<=r;++i)
        if(!c[x][s[i]-'a']) return 0;
        else x=c[x][s[i]-'a'];
    return val[x];
}

可以发现,顺着SAM查询子串,到达的状态是所有与查询的子串出现情况相类似(出现次数肯定是相同的)的子串集合,当然,待查子串也在这个集合里辣。



Blog来自PaperCloud,未经允许,请勿转载,TKS!

原文地址:https://www.cnblogs.com/PaperCloud/p/10321775.html

时间: 2024-08-30 18:02:48

[模板]后缀自动机的相关文章

后缀自动机(SAM)

*在学习后缀自动机之前需要熟练掌握WA自动机.RE自动机与TLE自动机* 什么是后缀自动机 后缀自动机 Suffix Automaton (SAM) 是一个用 O(n) 的复杂度构造,能够接受一个字符串所有后缀的自动机. 它最早在陈立杰的 2012 年 noi 冬令营讲稿中提到. 在2013年的一场多校联合训练中,陈立杰出的 hdu 4622 可以用 SAM 轻松水过,由此 SAM 流行了起来. 一般来说,能用后缀自动机解决的问题都可以用后缀数组解决.但是后缀自动机也拥有自己的优点. 1812.

浅谈对后缀自动机的一点理解

后缀自动机入门详解及模板 后缀自动机 自动机 要想了解后缀自动机,首先得了解自动机. 例如AC自动机,AC自动机可以识别一个字符串为其所匹配的前缀. 而我们今天所介绍的后缀自动机则是识别一个字符串为自动机串的子串. 在接下来的描述中为了方便,简称\(SAM\). 暴力实现 我们知道字典树有着优良的时空复杂度,并且可以支持识别一个字符串的前缀. 如果我们将串中的所有后缀插入进字典树,那么就可以实现这个自动机的功能. 不过,由于忽视了后缀的这个性质,总点数高达\(O(n^2)\). 即使如此,字典树

[数据结构]后缀自动机

前言 对于字符串 \(s\) ,\(|s|\) 表示s的长度 对于字符集 \(A\) , \(|A|\) 表示 \(A\) 的大小 本文字符串下标一律从0开始. 本文字数较多,如有错别字或者概念性错误,请联系博主或在下方回复. SAM 后缀自动机 (suffix automaton, SAM) 是一种解决多种字符串问题的数据结构. SAM基于一个字符串构建的,是给定字符串的所有子串的压缩形式. 标准定义为: 字符串 \(s\) 的SAM是一个接受 \(s\) 的所有后缀的最小 \(\texttt

hdu4622(后缀自动机模板)

题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4622 题意: 先输入一个长度为 n 的字符串, 然后有 q 个形如 l, r 的询问, 对于每个询问输出区间 [l, r] 中有多少不同的子串 思路: 后缀自动机模板 代码: 1 // 后缀自动机要理解其含义,从起点到每个点的不同路径,就是不同的子串. 2 // 到每一个点,不同路径,其实就是以这个点为最后一个字符的后缀,长度是介于(p->fa->len,p->len]之间的,个数也就清楚

【模板整合】SAM后缀自动机的构建

太弱了QAQ学完SAM这么久才学会构建QAQ #include<iostream> #include<cstdio> #include<cstring> #include<cmath> #include<algorithm> #define MAXN 200010 using namespace std; struct sam { int p,q,np,nq; int cnt,last; int a[MAXN][26],len[MAXN],fa[

【Luogu3804】【模板】后缀自动机(后缀自动机)

[Luogu3804][模板]后缀自动机(后缀自动机) 题面 洛谷 题解 一个串的出现次数等于\(right/endpos\)集合的大小 而这个集合的大小等于所有\(parent\)树上儿子的大小 这样子的话,给每个终止位置的\(size\)记为\(1\) 然后按照拓扑序累加,这就是\(right/endpos\)集合的大小 最后对于每个\(size>1\)的节点,\(ans=max(longest*size)\) #include<iostream> #include<cstdi

洛谷P3804 - 【模板】后缀自动机

Portal Description 模板题啦~ 推荐WJMZBMR在WC2012上的讲义<后缀自动机>. Code //[模板]后缀自动机 #include <cstdio> int max(int x,int y) {return x>y?x:y;} int const N=2e6+10; int n; char s[N]; int rt,ndCnt,last; int fa[N],ch[N][26],len[N],siz[N]; void ins(int x) { in

广义后缀自动机模板

后缀自动机能解决很多单串的问题.但是一旦到了多串的情况.可能就会变得有些棘手 这个时候你可能会想能不能将多个串一起构建出和单串后缀自动机那样子拥有诸多优美性质的自动机呢? 答案当然是有的.那就是广义后缀自动机 对于广义后缀自动机.和普通的后缀自动机写法上有些许不同之处 大致就是在插入新串的时候.需要把当前状态指针 last 指回 root 还有一个问题.网上的人们都说广义后缀自动机在新插入节点的时候要判是否已经存在 这个就造成了代码的迥异 关于代码.借鉴了这个博客 ==> Click here

后缀自动机模板(初步)

看了几天居然连后缀自动机的构造原理和性质都没完全搞懂...更不用说应用了. 在这里膜一下先辈CLJ大神(的PPt),大神的世界就是不懂.另外还要膜一下国家集训队的几篇论文作者,表示还没看懂orz 先贴一个讲得通俗易懂的后缀自动机学习网站(蒟蒻的我居然仍然没看懂),讲得也够详细.学习网站 苦逼的我·一个下午就死记硬背了这篇代码.感觉:看代码比看论文里的长篇大论简单多了(我是蒟蒻). 代码贴上(终于背下来了): 1 #include<cstdio> 2 #include<string.h&g