【bzoj4212】神牛的养成计划 Trie树+可持久化Trie树

题目描述

Hzwer成功培育出神牛细胞,可最终培育出的生物体却让他大失所望......

后来,他从某同校女神 牛处知道,原来他培育的细胞发生了基因突变,原先决定神牛特征的基因序列都被破坏了,神牛hzwer很生气,但他知道基因突变的低频性,说不定还有以下优秀基因没有突变,那么他就可以用限制性核酸内切酶把它们切出来,然后再构建基因表达载体什么的,后面你懂的......

黄学长现在知道了N个细胞的DNA序列,它们是若干个由小写字母组成的字符串。一个优秀的基因是两个字符串s1和s2,当且仅当s1是某序列的前缀的同时,s2是这个序列的后缀时,hzwer认为这个序列拥有这个优秀基因。

现在黄学长知道了M个优秀基因s1和s2,它们想知道对于给定的优秀基因,有多少个细胞的DNA序列拥有它。

输入

第一行:N,表示序列数

接下来N行,每行一个字符串,代表N个DNA序列,它们的总长为L1

接下来一个M,表示询问数

接下来M行,每行两个字符串s1和s2,由一个空格隔开,hzwer希望你能在线回答询问,所以s1等于“s1”的所有字符按字母表的顺序向后移动ans位(字母表是一个环),ans为上一个询问的答案,s2同理。例如ans=2  “s1”=qz

则s1=sb。对于第一个询问,ans=0

s1和s2的总长度为L2

输出

输出M行,每行一个数,第i行的数表示有多少个序列拥有第i个优秀基因。

样例输入

10
emikuqihgokuhsywlmqemihhpgijkxdukjfmlqlwrpzgwrwozkmlixyxniutssasrriafu
emikuqihgokuookbqaaoyiorpfdetaeduogebnolonaoehthfaypbeiutssasrriafu
emikuqihgokuorocifwwymkcyqevdtglszfzgycbgnpomvlzppwrigowekufjwiiaxniutssasrriafu
emikuqihgokuorociysgfkzpgnotajcfjctjqgjeeiheqrepbpakmlixyxniutssasrriafu
emikuqihgokuorociysgfrhulymdxsqirjrfbngwszuyibuixyxniutssasrriafu
emikuqihgokuorguowwiozcgjetmyokqdrqxzigohiutssasrriafu
emikuqihgokuorociysgsczejjmlbwhandxqwknutzgdmxtiutssasrriafu
emikuqihgokuorociysgvzfcdxdiwdztolopdnboxfvqzfzxtpecxcbrklvtyxniutssasrriafu
emikuqihgokuorocsbtlyuosppxuzkjafbhsayenxsdmkmlixyxniutssasrriafu
emikuqihgokuorociysgfjvaikktsixmhaasbvnsvmkntgmoygfxypktjxjdkliixyxniutssasrriafu
10
emikuqihgokuorociysg yxniutssasrriafu
aiegqmedckgqknky eqpoowonnewbq
xfbdnjbazhdnhkhvb qrqgbnmlltlkkbtyn
bjfhrnfedlhrlolzfv qppxpoofxcr
zhdfpldcbjf stsidponnvnmmdvap
zhdfpldcbjfpjmjxdt gdstsidponnvnmmdvap
dlhjtphgfnjtnqnbhxr wxwmhtsrrzrqqhzet
bjfhrnfedlhrlolzfv frqppxpoofxcr
zhdfpldcbjf dponnvnmmdvap
ucyakgyxweakehes nondykjiiqihhyqvk

样例输出

4
7
3
5
5
1
3
5
10
4



题解

Trie树+可持久化Trie树

一开始都蛋疼的想到树套树了 = =

先对所有字符串建立一棵Trie树。

然后DFS一遍得到的Trie树,按照DFS序将字符串的反串插入到可持久化Trie树中,并记录以每个节点为根的子树中的字符串的范围。

对于每个询问,将在Trie树中找s1,到达目标节点后可以直接拿出它包含字符串的范围,再将s2反过来,根据这个范围在可持久化Trie树中查找有多少个反串以它的反串为前缀(即以它为后缀),得到答案。

注意判无解的情况。

#include <cstdio>
#include <cstring>
#include <algorithm>
#define N 2000010
using namespace std;
int next[26][N] , fa[N] , tag[N] , lp[N] , rp[N] , tot = 1 , cnt , root[N] , c[26][N] , si[N] , num , len;
char str[N] , ch[N] , ss[N] , ll;
void insert(int x , int &y)
{
	int i , j , t = ++num;
	y = t;
	for(i = 0 ; i < len ; i ++ )
	{
		for(j = 0 ; j < 26 ; j ++ ) c[j][t] = c[j][x];
		c[str[i] - ‘a‘][t] = ++num , x = c[str[i] - ‘a‘][x] , t = c[str[i] - ‘a‘][t] , si[t] = si[x] + 1;
	}
	for(i = 0 ; i < 26 ; i ++ ) c[i][t] = c[i][x];
}
int query(int x , int y)
{
	int i;
	for(i = len - 1 ; ~i ; i -- ) x = c[str[i] - ‘a‘][x] , y = c[str[i] - ‘a‘][y];
	return si[y] - si[x];
}
void dfs(int x)
{
	int i;
	if(tag[x])
	{
		len = 0 , lp[x] = rp[x] = ++cnt;
		for(i = x ; i != 1 ; i = fa[i]) str[len ++ ] = ch[i];
		insert(root[cnt - 1] , root[cnt]);
		return;
	}
	lp[x] = 1 << 30 , rp[x] = -1 << 30;
	for(i = 0 ; i < 26 ; i ++ )
		if(next[i][x])
			dfs(next[i][x]) , lp[x] = min(lp[x] , lp[next[i][x]]) , rp[x] = max(rp[x] , rp[next[i][x]]);
}
void trans(char *s , int ans)
{
	int i , l = strlen(s);
	for(i = 0 ; i < l ; i ++ ) s[i] = (s[i] - ‘a‘ + ans) % 26 + ‘a‘;
}
int main()
{
	int n , m , i , j , l , t , ans = 0;
	scanf("%d" , &n);
	for(i = 1 ; i <= n ; i ++ )
	{
		scanf("%s" , str) , l = strlen(str);
		for(j = 0 , t = 1 ; j < l ; j ++ )
		{
			if(!next[str[j] - ‘a‘][t]) next[str[j] - ‘a‘][t] = ++tot , ch[tot] = str[j] , fa[tot] = t;
			t = next[str[j] - ‘a‘][t];
		}
		tag[t] = 1;
	}
	dfs(1);
	scanf("%d" , &m);
	for(i = 1 ; i <= m ; i ++ )
	{
		scanf("%s%s" , ss , str) , trans(ss , ans) , trans(str , ans) , l = strlen(ss) , len = strlen(str);
		for(j = 0 , t = 1 ; t && j < l ; j ++ ) t = next[ss[j] - ‘a‘][t];
		if(t) printf("%d\n" , ans = query(root[lp[t] - 1] , root[rp[t]]));
		else printf("%d\n" , ans = 0);
	}
	return 0;
}
时间: 2024-10-18 02:50:28

【bzoj4212】神牛的养成计划 Trie树+可持久化Trie树的相关文章

主席树/函数式线段树/可持久化线段树

什么是主席树 可持久化数据结构(Persistent data structure)就是利用函数式编程的思想使其支持询问历史版本.同时充分利用它们之间的共同数据来减少时间和空间消耗. 因此可持久化线段树也叫函数式线段树又叫主席树. 可持久化数据结构 在算法执行的过程中,会发现在更新一个动态集合时,需要维护其过去的版本.这样的集合称为是可持久的. 实现持久集合的一种方法时每当该集合被修改时,就将其整个的复制下来,但是这种方法会降低执行速度并占用过多的空间. 考虑一个持久集合S. 如图所示,对集合的

主席树 | | 可持久化线段树

可持久化数据结构(Persistent data structure)就是利用函数式编程的思想使其支持询问历史版本.同时充分利用它们之间的共同数据来减少时间和空间消耗. 所以这里讲的可持久化线段树也叫函数式线段树(又叫主席树……因为先驱就是fotile主席Orz……). 先了解一下主席树 http://seter.is-programmer.com/posts/31907.html    很详细的介绍了函数式线段树(主席树). 主席树其实就是很多棵线段树,由于每次更新只需要更新logN个节点,所

BZOJ 3439 Kpm的MC密码 Trie树+可持久化线段树

题目大意:给定n个字符串,对于每个字符串求以这个字符串为后缀的字符串中第k小的编号 首先将字符串反转 那么就变成了对于每个字符串求以这个字符串为前缀的字符串中第k小的编号 然后考虑对字符串排序 那么对于每个字符串以它为前缀的字符串一定是连续的 那么就转化成了区间第k小 这个用可持久化线段树可以解决 排序自然不能直接排 既然是字符串 考虑Trie树+DFS即可 注意字符串有重复的 小心 #include <vector> #include <cstdio> #include <

[BZOJ 3207] 花神的嘲讽计划Ⅰ【Hash + 可持久化线段树】

题目链接:BZOJ - 3207 题目分析 先使用Hash,把每个长度为 k 的序列转为一个整数,然后题目就转化为了询问某个区间内有没有整数 x . 这一步可以使用可持久化线段树来做,虽然感觉可以有更简单的做法,但是我没有什么想法... 代码 #include <iostream> #include <cstdio> #include <cstdlib> #include <algorithm> #include <cstring> #inclu

BZOJ 3207 花神的嘲讽计划I Hash+可持久化线段树

题目大意:给定一个数字串,多次求某个区间内有没有一个长度为k的子串 首先对字符串进行哈希 然后问题就转化成了求一个区间内有没有某个数 可持久化线段树即可 其实我觉得划分树会更快一些 可以写写 ※注意事项: 1.n<=200000 我找不到数据范围是眼科大夫去找老阎的关系? 2.哈希值用unsigned long long 铁则 unsigned int 会被卡掉 3.线段树那里直接x+y>>1会爆unsigned long long 转换一下 x+y>>1=(x>>

归并树 划分树 可持久化线段树(主席树) 入门题 hdu 2665

如果题目给出1e5的数据范围,,以前只会用n*log(n)的方法去想 今天学了一下两三种n*n*log(n)的数据结构 他们就是大名鼎鼎的 归并树 划分树 主席树,,,, 首先来说两个问题,,区间第k大 ,,,, 这个问题的通用算法是 划分树,, 说白一点就是把快速排序的中间结果存起来, 举个栗子 原数列 4 1 8 2 6 9 5 3 7 sorted 1 2 3 4 5 6 7 8 9 ........................... qs[0] 4 1 8 2 6 9 5 3 7 q

[TS-A1505] [清橙2013中国国家集训队第二次作业] 树 [可持久化线段树,求树上路径第k大]

按Dfs序逐个插入点,建立可持久化线段树,每次查询即可,具体详见代码. 不知道为什么,代码慢的要死,, #include <iostream> #include <algorithm> #include <cstdio> #include <cstdlib> #include <cstring> #include <cmath> #include <ctime> #include <vector> using

BZOJ 2527 Poi2011 Meteors 整体二分+线段树 / 可持久化线段树(MLE)

题目大意:给定一个环,每个节点有一个所属国家,k次事件,每次对[l,r]区间上的每个点点权加上一个值,求每个国家最早多少次操作之后所有点的点权和能达到一个值 首先我们考虑暴力想法 对于每个国家分开讨论 二分操作次数 但是这样每次Judge的时候我们要模拟1~mid所有的操作 浪费在这里的复杂度实在太大 这样做每个国家需要模拟O(klogk)次操作 时间复杂度O(nklogk) TLE 我们需要对浪费在这里的复杂度做一些改进 1.可持久化线段树(MLE) 每次二分一个mid之后 我们要找到mid次

权值线段树&amp;&amp;可持久化线段树&amp;&amp;主席树

权值线段树 顾名思义,就是以权值为下标建立的线段树. 现在让我们来考虑考虑上面那句话的产生的三个小问题: 1. 如果说权值作为下标了,那这颗线段树里存什么呢? ----- 这颗线段树中, 记录每个值出现的次数 2.权值很大怎么办?数组空间不够啊 ----- 可以先离散化,再记录 3.那权值线段树到底是用来干嘛的呢? ----- 可以快速求出第k小值(其实主要还是为了主席树做铺垫啦) 那第k小值该怎么求呢??? 从树根依次往下 若当前值K大于左儿子的值,则将K-=左儿子的值,然后访问右儿子 若当前