BZOJ 后缀自动机四·重复旋律7

后缀自动机四·重复旋律7

时间限制:15000ms

单点时限:3000ms

内存限制:512MB

描述

小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一段音乐旋律可以被表示为一段数构成的数列。

神奇的是小Hi发现了一部名字叫《十进制进行曲大全》的作品集,顾名思义,这部作品集里有许多作品,但是所有的作品有一个共同特征:只用了十个音符,所有的音符都表示成0-9的数字。

现在小Hi想知道这部作品中所有不同的旋律的“和”(也就是把串看成数字,在十进制下的求和,允许有前导0)。答案有可能很大,我们需要对(10^9 + 7)取摸。

解题方法提示

输入

第一行,一个整数N,表示有N部作品。

接下来N行,每行包含一个由数字0-9构成的字符串S。

所有字符串长度和不超过 1000000。

输出

共一行,一个整数,表示答案 mod (10^9 + 7)。

样例输入
2
101
09
样例输出
131

小Hi:我们已经学习了后缀自动机,今天我们再来看这道有意思的题。

小Ho:好!这道题目让我们求的是若干的数字串所有不同子串的和。

小Hi:你能不能结合后缀自动机的性质来思考如何解决本题?

小Ho:这道题目既然是关于子串,那么我知道从后缀自动机的所有状态中包含的子串的集合恰好对应原串的所有不重复子串。

小Hi:很好。那你可以先简化问题,想想只有一个串怎么做?

小Ho:好的。这个难不倒我。我上次已经知道如何计算一个串所有不同子串的数量,现在这题也类似,只不过计算更加复杂一点。

小Hi:那你可以详细说说。

小Ho:我们举个例子,假设S="1122124",其实就是我们熟悉的例子"aabbabd"啦。

状态 子串 endpos sum
S 空串   0
1 1 {1,2,5} 1
2 11 {2} 11
3 112 {3} 112
4 1122,122,22 {4} 1266
5 2 {3,4,6} 2
6 11221,1221,221,21 {5} 12684
7 112212,12212,2212,212 {6} 126848
8 12 {3,6} 12
9 1122124,122124,22124,2124,124,24,4 {7} 1248648

小Ho:如果我们能像上面的表格一样求出每个状态中包含的子串的"和",不妨记为sum(st)。那么我们只要求出Σsum(st)就是答案了。

小Hi:那你讲讲怎么求出每个状态的和?

小Ho:从初始状态开始一个个递推出来咯。比如我们现在要求状态6也就是{11221,1221,221,21}的和。我们知道到达状态6的边(transition)有2条,分别是trans[4][1]和trans[5][1]。如果我们已经求出sum(4) = 1266, sum(5)=2,那么我们就可以求出sum(6)=(sum(4) * 10 + 1 * |substrings(4)|]) + (sun(5) * 10 + 1 * |substring(5)|) = (12660 + 1 * 3) + (2 * 10 + 1 * 1) = 12684。

小Ho:换句话说,状态6里的{11221, 1221, 221}这三个子串是从状态4的所有(3个)子串乘以10再加1得到的;状态6里的{21}这个子串是从状态5的所有(1个)子串乘以10再加1得到的。也就是说对于状态st

sum(st) = Σ{sum(x) * 10 + c * |substrings(x)| | trans[x][c] = st}。

小Ho:我们知道SAM的状态和转移构成了一个有向无环图,我们只要求出状态的拓扑序,依次求出sum(st)即可。

小Hi:不错嘛。那我们回到原题的多个串的情况,怎么解决?

小Ho:多个串我就不会了 ┑( ̄Д  ̄)┍

小Hi:还记得我们第122周用后缀数组求多个串的最长公共字串时用到的技巧么?

小Ho:把多个串用‘#‘连接起来当作一个串来处理?

小Hi:没错。这次我们也使用这种方法,把所有串用冒号‘:‘ (‘:‘的ACII码是58,也就是‘0‘的ASCII码+10,方便处理) 连接以来。以两个串"12"和"234"为例,"12:234"的SAM如图:

 ‘

状态 子串 endpos |valid-substrings| sum
S 空串   1 0
1 1 {1} 1 1
2 12 {2} 1 12
3 12:,2:,: {3} 0 0
4 12:2,2:2,:2 {4} 0 0
5 2 {2,4} 1 2
6 12:23,2:23,:23,23,3 {5} 2 26
7 12:234,2:234,:234,234,34,4 {6} 3 272

小Ho:看上去如果我们把每个状态中带冒号的子串都排除掉,好像也是可以递推的!

小Hi:没错。如果我们用valid-substrings(st)表示一个状态中所有的不带冒号的子串,那么对于sum(st)我们有类似的递推式

sum(st) = Σ{sum(x) * 10 + c * |valid-substrings(x)| | trans[x][c] = st}

小Ho:那么关键就是|valid-substrings(st)|怎么求出来了?

小Hi:没错。|valid-substrings(st)|代表st中不带冒号的子串个数,这个值恰好就是从初始状态S到状态st的所有"不经过冒号转移的边"的路径数目。

小Ho:好像有点绕。

小Hi:举个例子,对于状态6,如果我们不经过标记为‘:‘的转移,那么从S到状态6一共有2条路径,是S->6和S->5->6,分别对应不带冒号的子串3和23。前面已经提到过SAM的状态和转移构成了一个有向无环图,有向无环图上的路径数目也是一个经典的拓扑排序问题,可以参考之前我们的讨论

小Ho:我明白了。建完SAM之后对所有状态拓扑排序,然后按拓扑序递推一边求出|valid-substrings(st)|,一边求出sum(st)就可以了。好了,我写程序去了。

依然是HiHo怎么说,我们怎么做,2333~~~

  1 #include <bits/stdc++.h>
  2
  3 #define fread_siz 1024
  4
  5 inline int get_c(void)
  6 {
  7     static char buf[fread_siz];
  8     static char *head = buf + fread_siz;
  9     static char *tail = buf + fread_siz;
 10
 11     if (head == tail)
 12         fread(head = buf, 1, fread_siz, stdin);
 13
 14     return *head++;
 15 }
 16
 17 inline int get_i(void)
 18 {
 19     register int ret = 0;
 20     register int neg = false;
 21     register int bit = get_c();
 22
 23     for (; bit < 48; bit = get_c())
 24         if (bit == ‘-‘)neg ^= true;
 25
 26     for (; bit > 47; bit = get_c())
 27         ret = ret * 10 + bit - 48;
 28
 29     return neg ? -ret : ret;
 30 }
 31
 32 inline int get_s(int *s)
 33 {
 34     register int ret = 0;
 35     register int bit = get_c();
 36
 37     while (bit < 48)
 38         bit = get_c();
 39
 40     while (bit > 47)
 41         *(s + ret++) = bit - 48,
 42         bit = get_c();
 43
 44     return ret;
 45 }
 46
 47 typedef long long lnt;
 48
 49 const int maxn = 2000005;
 50 const int mod  = 1000000007;
 51
 52 /* AUTOMATON */
 53
 54 int last = 1;
 55 int tail = 2;
 56 int fail[maxn];
 57 int step[maxn];
 58 int next[maxn][11];
 59
 60 inline void build(int *s)
 61 {
 62     while (~*s)
 63     {
 64         int c = *s++;
 65         int p = last;
 66         int t = tail++;
 67         step[t] = step[p] + 1;
 68         while (p && !next[p][c])
 69             next[p][c] = t, p = fail[p];
 70         if (p)
 71         {
 72             int q = next[p][c];
 73             if (step[q] == step[p] + 1)
 74                 fail[t] = q;
 75             else
 76             {
 77                 int k = tail++;
 78                 fail[k] = fail[q];
 79                 fail[q] = fail[t] = k;
 80                 step[k] = step[p] + 1;
 81                 for (int i = 0; i < 11; ++i)
 82                     next[k][i] = next[q][i];
 83                 while (p && next[p][c] == q)
 84                     next[p][c] = k, p = fail[p];
 85             }
 86         }
 87         else
 88             fail[t] = 1;
 89         last = t;
 90     }
 91 }
 92
 93 /* SOLVE PBM */
 94
 95 lnt ans;
 96 lnt sum[maxn];
 97 lnt sub[maxn];
 98 int cnt[maxn];
 99
100 inline void solve(void)
101 {
102     static int que[maxn];
103     static int inq[maxn];
104     static int head, tail;
105
106     head = 0, tail = 0;
107     que[tail++] = 1;
108     inq[1] = 1;
109
110     while (head != tail)
111     {
112         int u = que[head++];
113         for (int i = 0; i < 10; ++i)
114             if (next[u][i])
115             {
116                 ++cnt[next[u][i]];
117                 if (!inq[next[u][i]])
118                     inq[que[tail++] = next[u][i]] = 1;
119             }
120     }
121
122     head = 0, tail = 0;
123     que[tail++] = 1;
124     sub[1] = 1;
125
126     while (head != tail)
127     {
128         int u = que[head++], v;
129         ans += sum[u];
130         if (ans >= mod)
131             ans %= mod;
132         for (int i = 0; i < 10; ++i)
133             if (v = next[u][i])
134             {
135                 sub[v] += sub[u];
136                 sum[v] += sum[u] * 10 + i * sub[u];
137                 if (sub[v] >= mod)
138                     sub[v] %= mod;
139                 if (sum[v] >= mod)
140                     sum[v] %= mod;
141                 if (--cnt[v] == 0)
142                     que[tail++] = v;
143             }
144     }
145
146     printf("%lld\n", ans);
147 }
148
149 /* MAIN FUNC */
150
151 int s[maxn], len, n;
152
153 signed main(void)
154 {
155     n = get_i();
156
157     for (int i = 1; i <= n; ++i)
158     {
159         len += get_s(s + len);
160         s[len++] = 10;
161     }
162
163     s[len] = -1;
164
165     build(s);
166
167     solve();
168 }

@Author: YouSiki

时间: 2024-11-13 11:34:53

BZOJ 后缀自动机四·重复旋律7的相关文章

hihocoder #1457 : 后缀自动机四&#183;重复旋律7

#1457 : 后缀自动机四·重复旋律7 时间限制:15000ms 单点时限:3000ms 内存限制:512MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一段音乐旋律可以被表示为一段数构成的数列. 神奇的是小Hi发现了一部名字叫<十进制进行曲大全>的作品集,顾名思义,这部作品集里有许多作品,但是所有的作品有一个共同特征:只用了十个音符,所有的音符都表示成0-9的数字. 现在小Hi想知道这部作品中所有不同的旋律的“和”(也就是把串看成数字,在十进制下的求和,允许有前导0).答案有可能

后缀自动机四&#183;重复旋律7

后缀自动机四·重复旋律7 1 #include <bits/stdc++.h> 2 using namespace std; 3 const int maxn = 2000010; 4 const int mod = 1e9 + 7; 5 char s[maxn]; 6 int len[maxn<<1], tr[maxn<<1][11], link[maxn<<1]; 7 int sz, last; 8 void init(){ 9 sz = last =

hihocoder 1457 后缀自动机四&#183;重复旋律7 求不同子串的和

描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一段音乐旋律可以被表示为一段数构成的数列. 神奇的是小Hi发现了一部名字叫<十进制进行曲大全>的作品集,顾名思义,这部作品集里有许多作品,但是所有的作品有一个共同特征:只用了十个音符,所有的音符都表示成0-9的数字. 现在小Hi想知道这部作品中所有不同的旋律的“和”(也就是把串看成数字,在十进制下的求和,允许有前导0).答案有可能很大,我们需要对(10^9 + 7)取摸. 解题方法提示 × 解题方法提示 小Hi:我们已经学习了后缀自动机,今天

【后缀自动机】【拓扑排序】【动态规划】hihocoder1457 后缀自动机四&#183;重复旋律7

解题方法提示 小Hi:我们已经学习了后缀自动机,今天我们再来看这道有意思的题. 小Ho:好!这道题目让我们求的是若干的数字串所有不同子串的和. 小Hi:你能不能结合后缀自动机的性质来思考如何解决本题? 小Ho:这道题目既然是关于子串,那么我知道从后缀自动机的所有状态中包含的子串的集合恰好对应原串的所有不重复子串. 小Hi:很好.那你可以先简化问题,想想只有一个串怎么做? 小Ho:好的.这个难不倒我.我上次已经知道如何计算一个串所有不同子串的数量,现在这题也类似,只不过计算更加复杂一点. 小Hi:

hiho一下第128周 后缀自动机二&#183;重复旋律5

#1445 : 后缀自动机二·重复旋律5 时间限制:10000ms 单点时限:2000ms 内存限制:512MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一个音乐旋律被表示为一段数构成的数列. 现在小Hi想知道一部作品中出现了多少不同的旋律? 解题方法提示 输入 共一行,包含一个由小写字母构成的字符串.字符串长度不超过 1000000. 输出 一行一个整数,表示答案. 样例输入 aab 样例输出 5 解题方法提示 小Hi:本周的题目其实就是给定一个字符串S,要求出S的所有不同子串的数

后缀数组四&#183;重复旋律4

后缀数组四·重复旋律4 时间限制:5000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一个音乐旋律被表示为长度为 N 的数构成的数列.小Hi在练习过很多曲子以后发现很多作品中的旋律有重复的部分. 我们把一段旋律称为(k,l)-重复的,如果它满足由一个长度为l的字符串重复了k次组成. 如旋律abaabaabaaba是(4,3)重复的,因为它由aba重复4次组成. 小Hi想知道一部作品中k最大的(k,l)-重复旋律. 解题方法提示 输入 一

hihocoder #1449 : 后缀自动机三&#183;重复旋律6

#1449 : 后缀自动机三·重复旋律6 时间限制:15000ms 单点时限:3000ms 内存限制:512MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一个音乐旋律被表示为一段数构成的数列. 现在小Hi想知道一部作品中所有长度为K的旋律中出现次数最多的旋律的出现次数.但是K不是固定的,小Hi想知道对于所有的K的答案. 解题方法提示 × 解题方法提示 小Hi:上次我们已经学习了后缀自动机了,今天我们再来解决一个用到后缀自动机的问题. 小Ho:好!那我们开始吧! 小Hi:现在我们要对K

hihocoder #1465 : 后缀自动机五&#183;重复旋律8

#1465 : 后缀自动机五·重复旋律8 时间限制:10000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一段音乐旋律可以被表示为一段数构成的数列. 小Hi发现旋律可以循环,每次把一段旋律里面最前面一个音换到最后面就成为了原旋律的“循环相似旋律”,还可以对“循环相似旋律”进行相同的变换能继续得到原串的“循环相似旋律”. 小Hi对此产生了浓厚的兴趣,他有若干段旋律,和一部音乐作品.对于每一段旋律,他想知道有多少在音乐作品中的子串(重复便多

hiho一下第129周 后缀自动机二&#183;重复旋律6

后缀自动机三·重复旋律6 时间限制:15000ms 单点时限:3000ms 内存限制:512MB 描述 小Hi平时的一大兴趣爱好就是演奏钢琴.我们知道一个音乐旋律被表示为一段数构成的数列. 现在小Hi想知道一部作品中所有长度为K的旋律中出现次数最多的旋律的出现次数.但是K不是固定的,小Hi想知道对于所有的K的答案. 解题方法提示 输入 共一行,包含一个由小写字母构成的字符串S.字符串长度不超过 1000000. 输出 共Length(S)行,每行一个整数,表示答案. 样例输入 aab 样例输出