SPOJ_LCS2

和上个题目差不多,这次是找若干个串的LCS,若干<=10 。

做法上面也是类似的。

首先以第一个建立SAM,然后后面的串都在上面更新。每个串的更新是独立进行的,互不影响。对于同一状态,首先在同一个串的更新中取最大值,然后再不同的串之间取最小值,最后统计一下所有状态的最大值就可以了。

与上面不同的是,多了一个小小的操作,对于某一个状态存在一个匹配长度x,那么在该状态上所有的pre指针所指向的状态的的匹配长度都肯定会是step值。

一开始我也不理解为什么,后来发现后缀自动机的性质啦嘿嘿,(想一想就知道咯)。

但是为什么不更新pre指针会错呢?其实是这样的,每次加入一个字符匹配,当前只可能在一个状态,但是其实pre指针所有的位置都是可以进行匹配的。而且由于串很多,所有后面的串不一定都更新在这个状态,虽然他们的right位置是一样的。。(嗯,好像很有道理)

为什么上一个题目lcs没有对pre指针进行更新却依然正确呢?原因是不需要,对于每个状态step相当于与第一个模式串比配的最大长度,注意是最大,所以在第二个字符串来匹配的时候,当前状态的长度就是两个串在该状态的最大公共长度了。同时,在该状态的所有pre状态也肯定会存在匹配长复,但是那些肯定都不会优于这个状态,所以这个更新是不必要的,而对于多个串,由于每个串在可能分别落在不同的pre指针上,所以需要跟新一遍咯。

召唤代码君:

#include <iostream>
#include <cstdio>
#define maxn 200100
using namespace std;

int next[maxn][26],pre[maxn],step[maxn];
int f[13][maxn];
int N=0,last=0,n=1;
int p,q,np,nq;
char s[13][maxn];

void insert(int x,int m)
{
	np=++N,p=last,step[np]=m;
	while (p!=-1 && next[p][x]==0) next[p][x]=np,p=pre[p];
	last=np;
	if (p==-1) return;
	q=next[p][x];
	if (step[q]==step[p]+1) { pre[np]=q; return ; }
	nq=++N,step[nq]=step[p]+1,pre[nq]=pre[q];
	for (int i=0; i<26; i++) next[nq][i]=next[q][i];
	pre[np]=pre[q]=nq;
	for (; p!=-1 && next[p][x]==q;p=pre[p]) next[p][x]=nq;
}

void dp(int x)
{
	int cur=0,tmp=0;
	for (int i=0; s[x][i]; i++)
	{
		int k=s[x][i]-‘a‘;
		while (next[cur][k]==0 && cur!=0) cur=pre[cur];
		tmp=min(step[cur],tmp);
		cur=next[cur][k];
		if (cur) tmp++;
		f[x][cur]=max(f[x][cur],tmp);
	}
	for (int i=N; i>0; i--)
		if (f[x][i])
			for (int j=pre[i];j && f[x][j]!=step[j];j=pre[j]) f[x][j]=step[j];
}

int main()
{
	pre[0]=-1;
	while (scanf("%s",s[n])!=EOF) n++; n--;
	for (int i=0; s[1][i]; i++) insert(s[1][i]-‘a‘,i+1);
	for (int i=2; i<=n; i++) dp(i);
	int ans=0;
	for (int i=1; i<=N; i++)
	{
		int tmp=step[i];
		for (int j=2; j<=n; j++) tmp=min(tmp,f[j][i]);
		ans=max(ans,tmp);
	}
	printf("%d\n",ans);
	return 0;
}

  

SPOJ_LCS2

时间: 2024-10-29 07:22:27

SPOJ_LCS2的相关文章

后缀自动机/后缀树

只是笔记罢了,不要看 关于DAWG: 见紫书P390 把后缀自动机上所有节点都设为接受态就形成DAWG,可以接受一个字符串的所有子串. 一个子串的end-set是它在原串w中出现位置(从1开始编号)的右端点集合. 在DAWG中,end-set相同的子串属于同一个状态. 原因没原因,这应该算定义吧? 任意两个节点的end-set要么不相交,要么是包含关系. 原因:在DAWG上走一步,当前end-set的变化是将原end-set中各个元素+1(要去掉超出字符串长度的元素),然后拆分成1个或多个新en