SPOJ 220 Relevant Phrases of Annihilation(后缀数组+二分答案)

【题目链接】 http://www.spoj.pl/problems/PHRASES/

【题目大意】

  求在每个字符串中出现至少两次的最长的子串

【题解】

  注意到这么几个关键点:最长,至少两次,每个字符串。
  首先对于最长这个条件,我们可以想到二分答案,
  然后利用后缀数组所求得的三个数组判断是否满足条件。
  其次是出现两次,每次出现这个条件的时候,
  我们就应该要想到这是最大值最小值可以处理的,
  将出现在同一个字符串中的每个相同字符串的起始位置保存下来,
  如果最小值和最大值的差距超过二分长度L,则表明在这个字符串中这个条件是可行的。
  将所有的字符串通过拼接符连接在一起,做一遍后缀数组,
  现在我们根据h数组将大于二分长度的前后后缀分为一组,
  每当存在分组中的后缀数量大于2*n,
  就说明这个字符串有可能是我们需要的答案,那么对它进行检验,
  检验所有可能合法的字符串就可以完成对一个长度的判断了。

【代码】

#include <cstdio>
#include <cstring>
#include <vector>
#include <algorithm>
using namespace std;
const int N=1000010;
int n,m,rank[N],sa[N],h[N],tmp[N],cnt[N],ans,a[N],s[N]; char str[N];
void suffixarray(int n,int m){
    int i,j,k;n++;
    for(i=0;i<2*n+5;i++)rank[i]=sa[i]=h[i]=tmp[i]=0;
    for(i=0;i<m;i++)cnt[i]=0;
    for(i=0;i<n;i++)cnt[rank[i]=s[i]]++;
    for(i=1;i<m;i++)cnt[i]+=cnt[i-1];
    for(i=0;i<n;i++)sa[--cnt[rank[i]]]=i;
    for(k=1;k<=n;k<<=1){
        for(i=0;i<n;i++){
            j=sa[i]-k;
            if(j<0)j+=n;
            tmp[cnt[rank[j]]++]=j;
        }sa[tmp[cnt[0]=0]]=j=0;
        for(i=1;i<n;i++){
            if(rank[tmp[i]]!=rank[tmp[i-1]]||rank[tmp[i]+k]!=rank[tmp[i-1]+k])cnt[++j]=i;
            sa[tmp[i]]=j;
        }memcpy(rank,sa,n*sizeof(int));
        memcpy(sa,tmp,n*sizeof(int));
        if(j>=n-1)break;
    }for(j=rank[h[i=k=0]=0];i<n-1;i++,k++)
    while(~k&&s[i]!=s[sa[j-1]+k])h[j]=k--,j=rank[sa[j]+1];
}int first=0,len[N],u,K;
vector<int> S[N];
int Min[15],Max[15];
bool check(int L){
    int cur=-1;
    for(int i=1;i<=u;i++){
        if(h[i]<L)S[++cur].clear();
        S[cur].push_back(i);
    }
    for(int i=0;i<=cur;i++){
        if(S[i].size()>=2*n){
            memset(Min,-1,sizeof(Min));
            memset(Max,-1,sizeof(Max));
            for(int j=0;j<S[i].size();j++){
                int k=S[i][j];
                int x=upper_bound(a,a+n+1,sa[k])-a-1;
                Min[x]=Min[x]==-1?sa[k]:min(Min[x],sa[k]);
                Max[x]=Max[x]==-1?sa[k]:max(Max[x],sa[k]);
            }bool flag=1;
            for(int i=0;i<n;i++){
                if(Min[i]==-1||Max[i]-Min[i]<L){flag=0;break;}
            }if(flag)return 1;
        }
    }return 0;
}int T;
int main(){
    scanf("%d",&T);
    while(T--){
        scanf("%d",&n);
        int tmp=200; u=0;
        for(int i=0;i<n;i++){
			scanf("%s",str);
			len[i]=strlen(str);
        	for(int j=0;j<len[i];j++)s[u++]=(int)str[j];
        	s[u++]=tmp++;
        }tmp=0; s[u]=0; //注意处理完的字符串最后封零
        for(int i=0;i<=n;i++){
            a[i]=tmp;
            if(i<n)tmp=tmp+(i==0?len[i]:len[i]+1);
        }suffixarray(u,310);
        int l=1,r=10000,ans=0;
        while(l<=r){
            int mid=(l+r)>>1;
            if(check(mid))ans=mid,l=mid+1;
            else r=mid-1;
        }printf("%d\n",ans);
    }return 0;
}

  

时间: 2024-10-17 12:58:32

SPOJ 220 Relevant Phrases of Annihilation(后缀数组+二分答案)的相关文章

SPOJ 220. Relevant Phrases of Annihilation(后缀数组多次不重叠子串)

题目大意:给定N个串,求每个串至少出现两次的最长子串. 解题思路:每个字符串至少出现两次且不可重叠的最长子串:二分枚举长度后在同一分组中对每一个字符串保留一个最小的位置和一个最大的位置,最后查看是否每个串在同一组中都有至少两个后缀,并且后缀的坐标差大于枚举的长度. POJ Problem Set (classical) 220. Relevant Phrases of Annihilation Problem code: PHRASES You are the King of Byteland.

SPOJ 220 Relevant Phrases of Annihilation (后缀数组)

题目大意: 求在m个串中同时出现两次以上且不覆盖的子串的长度. 思路分析: 二分答案,然后check是否满足,判断不覆盖的方法就是用up down 来处理边界. #include <cstdio> #include <iostream> #include <algorithm> #include <cstring> #include <map> #include <string> #define maxn 110005 using n

SPOJ220 Relevant Phrases of Annihilation(后缀数组)

引用罗穗骞论文中的话: 先将n 个字符串连起来,中间用不相同的且没有出现在字符串中的字符隔开,求后缀数组.然后二分答案,再将后缀分组.判断的时候,要看是否有一组后缀在每个原来的字符串中至少出现两次,并且在每个原来的字符串中,后缀的起始位置的最大值与最小值之差是否不小于当前答案(判断能否做到不重叠,如果题目中没有不重叠的要求,那么不用做此判断).这个做法的时间复杂度为O(nlogn). 二分枚举长度,对每个长度遍历height[]数组,将height[]数组分块,每个块内任意两串的lcp均大于等于

POJ 1743 Musical Theme(后缀数组+二分答案)

[题目链接] http://poj.org/problem?id=1743 [题目大意] 给出一首曲子的曲谱,上面的音符用不大于88的数字表示, 现在请你确定它主旋律的长度,主旋律指的是出现超过一次, 并且长度不小于5的最长的曲段,主旋律出现的时候并不是完全一样的, 可能经过了升调或者降调,也就是说, 是原来主旋律所包含的数字段同时加上或者减去一个数所得, 当然,两段主旋律之间也是不能有重叠的,现在请你求出这首曲子主旋律的长度, 如果不存在请输出0. [题解] 首先要处理的是升调和降调的问题,由

POJ 3080 Blue Jeans(后缀数组+二分答案)

[题目链接] http://poj.org/problem?id=3080 [题目大意] 求k个串的最长公共子串,如果存在多个则输出字典序最小,如果长度小于3则判断查找失败. [题解] 将所有字符串通过拼接符拼成一个串,做一遍后缀数组,二分答案,对于二分所得值,将h数组大于这个值的相邻元素分为一组,判断组内元素是否覆盖全字典,是则答案成立,对于答案扫描sa,输出第一个扫描到的子串即可. [代码] #include <cstdio> #include <cstring> #inclu

POJ 3294 Life Forms(后缀数组+二分答案)

[题目链接] http://poj.org/problem?id=3294 [题目大意] 求出在至少在一半字符串中出现的最长子串. 如果有多个符合的答案,请按照字典序输出. [题解] 将所有的字符串通过不同的拼接符相连,作一次后缀数组, 二分答案的长度,然后在h数组中分组,判断是否可行, 按照sa扫描输出长度为L的答案即可.注意在一个子串中重复出现答案串的情况. [代码] #include <cstdio> #include <cstring> #include <vecto

POJ 3261 Milk Patterns(后缀数组+二分答案)

[题目链接] http://poj.org/problem?id=3261 [题目大意] 求最长可允许重叠的出现次数不小于k的子串. [题解] 对原串做一遍后缀数组,二分子串长度x,将前缀相同长度超过x的后缀分组, 如果存在一个大小不小于k的分组,则说明答案可行,分治得到最大可行解就是答案. [代码] #include <cstdio> #include <cstring> #include <vector> using namespace std; const int

POJ3294--Life Forms 后缀数组+二分答案 大于k个字符串的最长公共子串

Life Forms Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 10800   Accepted: 2967 Description You may have wondered why most extraterrestrial life forms resemble humans, differing by superficial traits such as height, colour, wrinkles, e

poj1743 后缀数组+二分答案

1.给定一个字符串,求最长重复子串,这两个子串可以重叠. 这道题是后缀数组的一个简单应用.做法比较简单,只需要求 height 数组里的最大值即可.2.给定一个字符串,求最长重复子串,这两个子串不能重叠. 这题比上一题稍复杂一点.先二分答案,把题目变成判定性问题:判断是否存在两个长度为 k 的子串是相同的,且不重叠.解决这个问题的关键还是利用height 数组.把排序后的后缀分成若干组,其中每组的后缀之间的 height 值都不小于 k.例如,字符串为“aabaaaab ” ,当 k=2 时,后