P3804 【模板】后缀自动机

\(\color{#0066ff}{ 题目描述 }\)

给定一个只包含小写字母的字符串\(S\),

请你求出 \(S\) 的所有出现次数不为 \(1\) 的子串的出现次数乘上该子串长度的最大值。

\(\color{#0066ff}{输入格式}\)

一行一个仅包含小写字母的字符串\(S\)

\(\color{#0066ff}{输出格式}\)

一个整数,为 所求答案

\(\color{#0066ff}{输入样例}\)

abab

\(\color{#0066ff}{输出样例}\)

4

\(\color{#0066ff}{数据范围与提示}\)

对于\(10\%\)的数据,\(∣S∣\leq 1000\)

对于\(100\%\)的数据,\(|S|\leq 10^6\)

\(\color{#0066ff}{ 题解 }\)

后缀自动机是一个可以维护所有字串的最简自动机

时间空间复杂度均为\(O(n)\)

是一个非常优秀的东西

本题要求出所有出现次数不为1的字串

那么考虑parent树

如果一个点所在子树有大于1个叶子节点,就说明当前字串出现次数超过1(每个叶子都是前缀)

但是我们parent树只记录了父亲

没有关系

不难发现,叶子节点维护的是一个前缀,也就是后缀链上最长的

所以我们可以通过鸡排来自下而上统计叶子个数

这题, 数组大小开成偶数会TLE我也不知道为啥

#include<bits/stdc++.h>
using namespace std;
#define LL long long
LL in() {
    char ch; int x = 0, f = 1;
    while(!isdigit(ch = getchar()))(ch == '-') && (f = -f);
    for(x = ch ^ 48; isdigit(ch = getchar()); x = (x << 1) + (x << 3) + (ch ^ 48));
    return x * f;
}
const int maxn = 2e6 + 5;
struct SAM {
protected:
    struct node {
        node *ch[26], *fa;
        int len, siz;
        node(int len = 0, int siz = 0): fa(NULL), len(len), siz(siz) {
            memset(ch, 0, sizeof ch);
        }
    };
    node *root, *tail, *lst;
    node pool[maxn], *id[maxn];
    int c[maxn];
    void extend(int c) {
        node *o = new(tail++) node(lst->len + 1, 1), *v = lst;
        for(; v && !v->ch[c]; v = v->fa) v->ch[c] = o;
        if(!v) o->fa = root;
        else if(v->len + 1 == v->ch[c]->len) o->fa = v->ch[c];
        else {
            node *n = new(tail++) node(v->len + 1), *d = v->ch[c];
            std::copy(d->ch, d->ch + 26, n->ch);
            n->fa = d->fa, d->fa = o->fa = n;
            for(; v && v->ch[c] == d; v = v->fa) v->ch[c] = n;
        }
        lst = o;
    }
    void clr() {
        tail = pool;
        root = lst = new(tail++) node();
    }
public:
    SAM() { clr(); }
    void ins(char *s) { for(char *p = s; *p; p++) extend(*p - 'a'); }
    LL getans() {
        LL ans = 0;
        int len = tail - pool, maxlen = 0;
        for(node *o = pool; o != tail; o++) c[o->len]++, maxlen = std::max(maxlen, o->len);
        for(int i = 1; i <= maxlen; i++) c[i] += c[i - 1];
        for(node *o = pool; o != tail; o++) id[--c[o->len]] = o;
        for(int i = len - 1; i; i--) {
            node *o = id[i];
            o->fa->siz += o->siz;
            if(o->siz > 1) ans = std::max(ans, 1LL * o->siz * o->len);
        }
        return ans;
    }
}sam;
int main() {
    static char s[maxn];
    scanf("%s", s);
    sam.ins(s);
    printf("%lld", sam.getans());
    return 0;
}

原文地址:https://www.cnblogs.com/olinr/p/10251693.html

时间: 2024-08-30 17:49:53

P3804 【模板】后缀自动机的相关文章

[模板]后缀自动机

传送门 Description 给定一个只包含小写字母的字符串\(S\), 请你求出 \(S\) 的所有出现次数不为 \(1\) 的子串的出现次数乘上该子串长度的最大值. Solution 保持好习惯吧,模板题还是放一下 SAM的板子,想必是到处都有,反正都比我写的好看... 当初想学SAM的时候,就被某俄文翻译的\(20000\)字论文吓跑了... 核心? 作为一种可以表示所有后缀的状态的自动机,它得满足状态数尽可能的小 SAM的做法: 每个状态表示所有\(Right\)集合相同的子串,这里\

后缀自动机(SAM)

*在学习后缀自动机之前需要熟练掌握WA自动机.RE自动机与TLE自动机* 什么是后缀自动机 后缀自动机 Suffix Automaton (SAM) 是一个用 O(n) 的复杂度构造,能够接受一个字符串所有后缀的自动机. 它最早在陈立杰的 2012 年 noi 冬令营讲稿中提到. 在2013年的一场多校联合训练中,陈立杰出的 hdu 4622 可以用 SAM 轻松水过,由此 SAM 流行了起来. 一般来说,能用后缀自动机解决的问题都可以用后缀数组解决.但是后缀自动机也拥有自己的优点. 1812.

浅谈对后缀自动机的一点理解

后缀自动机入门详解及模板 后缀自动机 自动机 要想了解后缀自动机,首先得了解自动机. 例如AC自动机,AC自动机可以识别一个字符串为其所匹配的前缀. 而我们今天所介绍的后缀自动机则是识别一个字符串为自动机串的子串. 在接下来的描述中为了方便,简称\(SAM\). 暴力实现 我们知道字典树有着优良的时空复杂度,并且可以支持识别一个字符串的前缀. 如果我们将串中的所有后缀插入进字典树,那么就可以实现这个自动机的功能. 不过,由于忽视了后缀的这个性质,总点数高达\(O(n^2)\). 即使如此,字典树

[数据结构]后缀自动机

前言 对于字符串 \(s\) ,\(|s|\) 表示s的长度 对于字符集 \(A\) , \(|A|\) 表示 \(A\) 的大小 本文字符串下标一律从0开始. 本文字数较多,如有错别字或者概念性错误,请联系博主或在下方回复. SAM 后缀自动机 (suffix automaton, SAM) 是一种解决多种字符串问题的数据结构. SAM基于一个字符串构建的,是给定字符串的所有子串的压缩形式. 标准定义为: 字符串 \(s\) 的SAM是一个接受 \(s\) 的所有后缀的最小 \(\texttt

洛谷P3804 - 【模板】后缀自动机

Portal Description 模板题啦~ 推荐WJMZBMR在WC2012上的讲义<后缀自动机>. Code //[模板]后缀自动机 #include <cstdio> int max(int x,int y) {return x>y?x:y;} int const N=2e6+10; int n; char s[N]; int rt,ndCnt,last; int fa[N],ch[N][26],len[N],siz[N]; void ins(int x) { in

hdu4622(后缀自动机模板)

题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4622 题意: 先输入一个长度为 n 的字符串, 然后有 q 个形如 l, r 的询问, 对于每个询问输出区间 [l, r] 中有多少不同的子串 思路: 后缀自动机模板 代码: 1 // 后缀自动机要理解其含义,从起点到每个点的不同路径,就是不同的子串. 2 // 到每一个点,不同路径,其实就是以这个点为最后一个字符的后缀,长度是介于(p->fa->len,p->len]之间的,个数也就清楚

【模板整合】SAM后缀自动机的构建

太弱了QAQ学完SAM这么久才学会构建QAQ #include<iostream> #include<cstdio> #include<cstring> #include<cmath> #include<algorithm> #define MAXN 200010 using namespace std; struct sam { int p,q,np,nq; int cnt,last; int a[MAXN][26],len[MAXN],fa[

【Luogu3804】【模板】后缀自动机(后缀自动机)

[Luogu3804][模板]后缀自动机(后缀自动机) 题面 洛谷 题解 一个串的出现次数等于\(right/endpos\)集合的大小 而这个集合的大小等于所有\(parent\)树上儿子的大小 这样子的话,给每个终止位置的\(size\)记为\(1\) 然后按照拓扑序累加,这就是\(right/endpos\)集合的大小 最后对于每个\(size>1\)的节点,\(ans=max(longest*size)\) #include<iostream> #include<cstdi

广义后缀自动机模板

后缀自动机能解决很多单串的问题.但是一旦到了多串的情况.可能就会变得有些棘手 这个时候你可能会想能不能将多个串一起构建出和单串后缀自动机那样子拥有诸多优美性质的自动机呢? 答案当然是有的.那就是广义后缀自动机 对于广义后缀自动机.和普通的后缀自动机写法上有些许不同之处 大致就是在插入新串的时候.需要把当前状态指针 last 指回 root 还有一个问题.网上的人们都说广义后缀自动机在新插入节点的时候要判是否已经存在 这个就造成了代码的迥异 关于代码.借鉴了这个博客 ==> Click here