2746: [HEOI2012]旅行问题
Time Limit: 30 Sec Memory Limit: 256 MB
Submit: 1009 Solved: 318
[Submit][Status][Discuss]
Description
yz是Z国的领导人,他规定每个地区的名字只能为26个小写拉丁字母的一个。由于地 区数有可能超过26个,便产生了一个问题,如何辨别名字相同的地区?于是yz规定,一个 地区的描述必须包含它的所有上级,且上级按次序排列。于是,一个地区的描述是一个字符 串。比如说,一个地区的名字为c,它的上级为b,b的上级为a,a没有上级,那么这个地 区就描述为abc。显然,这个描述同时包含了c的上级b和b的上级a的描述,分别为ab和a。 值得注意的是,每个地区最多有一个上级,同一上级的地区之间名字不同,没有上级的 地区之间名字不同。现在,yz对外公布了n个地区的描述,这些描述中包含了Z国所有地区的描述,并让 你处理来访者的旅行问题。现有m对人访问这个国家,对于每对人,第一个人喜欢第i个描述中的第j个地区,设 这个地区描述为s1,第二个人喜欢第k个描述中的第l个地区,设这个地区描述为s2。他们为了统一行程,决定访问描述为s的地区(显然他们只关心地区的名字,并非是地区本身), 设s的长度为t,s需要满足以下条件:
1:t<=j, t<=l;
1:s[1..t] = s1[j-t+1 … j], s[1..t] = s2[l-t+1 … l];(即s为s1中1到k位 与s2中1到l位的公共后缀)
2:t最大化。
为了不使输出过大,你只需把这个字符串按照如下生成的26进制数转成10进制后mod 1000000007后输出:
a->0
b->1
.
.
.
z->25
比如地区cab被编码成2 * 26? + 0 * 26? + 1 * 26? = 1353。
Input
第一行给定一个整数n
第2…n+1行:每i+1行给定一个字符串a[i],表示第i个描述。
接下来一行一个整数m
接下来m行:每行给定四个整数i,j,k,l,字母含义与题目描述一致。
Output
共m行,每行一个整数,表示答案字符串的编码。
Sample Input
2
aabb babb
2
1 3 2 3
1 4 2 4
Sample Output
1
1
【样例说明】
询问1中的公共后缀有ab和b,但是没有ab这个地区,只有b地区,所以只能选择b这个 地区;
询问2中的公共后缀有abb、bb和b,但是没有abb和bb这两个地区,只有b地区,所以 只能选择b这个地区。
HINT
【数据范围】
设这个国家地区总数数为tot(注意:输入的字符串总长度可能超过tot!) 对于30%的数据,满足tot,m,n<=100;
对于50%的数据,满足tot,m,n<=1000;
对于80%的数据,满足tot,m,n<=100000;
对于100%的数据,满足tot,m,n<=1000000;
保证输入文件不超过20MB。
1、AC自动机构造fail树,抽离fail树构图(失配指针指向的点 向 当前点 连边)
2、在fail树中找到 s1、s2 的结尾点,两点的lca就是答案
正确性分析:
fail指针定义:在其他串中找一个最长的 前缀等于这个串的后缀
在fail树构出的图中,沿fail指针向上跳所经过的点,一定是当前串的最长后缀
且越往上跳,后缀长度单调不上升
题目要求:两个串的最长公共后缀,且这个后缀是某个串的前缀
所以就是两个串的结尾点在fail树中的lca
这题卡空间,卡空间
数组范围抄的大佬的题解
1、lca
① 抽离fail树构图求lca时,因为空间有限,所以不选树链剖分,用倍增法
② 因为点的父节点就是失配指针指向的点,所以可以在求fail指针时,同时算出deep,f[i][0]
③ 节省一个dfs 时间,所以倍增求lca时,选用根据深度判断的方法,而不是dfs序
节省链表重新构图空间、时间,所以不用树链剖分、dfs序倍增法
2、锁定字符串末节点的位置
① 节省时间,不在AC自动机上匹配一遍,因为告诉了了第i个字符串的前j个,所以在insert字符串时,可以记录
② 节省空间,不用二维数组a[N][26]表示第i个字符串的第j个节点在AC自动机的什么位置
因为是顺序插入,用一个st[i]数组,表示前i-1个字符串用了多少个节点,
pos[i]数组,表示所有字符串的第i个字母在AC自动机的那个位置(第1个字符串的所有字母在最前面,然后是第2个字符串,第3、4……)
这样第i个字符串的第j个字母在AC自动机中的位置就是 pos[st[i]+j]
为什么要引入st数组?因为AC自动机相同前缀用同一个节点
代码中倍增求lca时,循环到了20,
我的理解:只需循环到log2(n)+1 ,因为倍增是2^i,i大了没用
但是 引入 int p=log(n)/log(2)+1; 就错了
(c++ 默认log函数以自然对数为底)
call 大佬求解
#include<cmath> #include<queue> #include<cstdio> #include<cstring> #include<algorithm> #define N 1000010 #define mod 1000000007 using namespace std; char s[N]; int pos[N*8],st[N],cnt; // int key[N]; int n,m,iid,len,root,p; int tot=1,trie[N][26]; int ancestor[N][22],deep[N]; queue<int>q; struct TREE { void pre() { for(int i=1;i<=20;i++) for(int j=1;j<=tot;j++) ancestor[j][i]=ancestor[ancestor[j][i-1]][i-1]; } int getlca(int u,int v) { if(deep[u]<deep[v]) swap(u,v); for(int i=0;i<=20;i++) if((deep[u]-deep[v])&(1<<i)) u=ancestor[u][i]; if(u==v) return u; for(int i=20;i>=0;i--) if(ancestor[u][i]!=ancestor[v][i]) { u=ancestor[u][i]; v=ancestor[v][i]; } return ancestor[u][0]; } }; TREE tree; struct ACautomata { void insert(int k) { st[k]=cnt; len=strlen(s); root=1; for(int i=0;i<len;i++) { iid=s[i]-‘a‘; if(!trie[root][iid]) { trie[root][iid]=++tot; key[tot]=(1ll*key[root]*26+iid)%mod; } root=trie[root][iid]; pos[++cnt]=root; } } void getfail() { for(int i=0;i<26;i++) trie[0][i]=1; q.push(1); int now,j; while(!q.empty()) { now=q.front(); q.pop(); for(int i=0;i<26;i++) { if(!trie[now][i]) { trie[now][i]=trie[ancestor[now][0]][i]; continue; } q.push(trie[now][i]); j=ancestor[now][0]; //while(!trie[j][i]) j=ancestor[j][0]; ancestor[trie[now][i]][0]=trie[j][i]; deep[trie[now][i]]=deep[trie[j][i]]+1; } } } }; ACautomata AC; int main() { scanf("%d",&n); // int p=log(n)/log(2)+1; for(int i=1;i<=n;i++) { scanf("%s",s); AC.insert(i); } AC.getfail(); tree.pre(); scanf("%d",&m); int i,j,k,l,r1,r2,lca; while(m--) { scanf("%d%d%d%d",&i,&j,&k,&l); lca=tree.getlca(pos[st[i]+j],pos[st[k]+l]); printf("%d\n",key[lca]); } }