POJ3294 Life Forms(二分+后缀数组)

给n个字符串,求最长的多于n/2个字符串的公共子串。

依然是二分判定+height分组。

  • 把这n个字符串连接,中间用不同字符隔开,跑后缀数组计算出height;
  • 二分要求的子串长度,判断是否满足:height分组,统计一个组不同的字符串个数是否大于n/2;
  • 最后输出方案,根据二分得出的子串长度的结果,直接再遍历一遍height,因为这儿是有序的后缀所以找到一个就直接输出。
  1 #include<cstdio>
  2 #include<cstring>
  3 #include<cmath>
  4 #include<algorithm>
  5 using namespace std;
  6 #define MAXN 111000
  7
  8 int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN];
  9 int cmp(int *r,int a,int b,int l){
 10     return r[a]==r[b] && r[a+l]==r[b+l];
 11 }
 12 int sa[MAXN],rank[MAXN],height[MAXN];
 13 void SA(int *r,int n,int m){
 14     int *x=wa,*y=wb;
 15
 16     for(int i=0; i<m; ++i) ws[i]=0;
 17     for(int i=0; i<n; ++i) ++ws[x[i]=r[i]];
 18     for(int i=1; i<m; ++i) ws[i]+=ws[i-1];
 19     for(int i=n-1; i>=0; --i) sa[--ws[x[i]]]=i;
 20
 21     int p=1;
 22     for(int j=1; p<n; j<<=1,m=p){
 23         p=0;
 24         for(int i=n-j; i<n; ++i) y[p++]=i;
 25         for(int i=0; i<n; ++i) if(sa[i]>=j) y[p++]=sa[i]-j;
 26         for(int i=0; i<n; ++i) wv[i]=x[y[i]];
 27         for(int i=0; i<m; ++i) ws[i]=0;
 28         for(int i=0; i<n; ++i) ++ws[wv[i]];
 29         for(int i=1; i<m; ++i) ws[i]+=ws[i-1];
 30         for(int i=n-1; i>=0; --i) sa[--ws[wv[i]]]=y[i];
 31         swap(x,y); x[sa[0]]=0; p=1;
 32         for(int i=1; i<n; ++i) x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
 33     }
 34
 35     for(int i=1; i<n; ++i) rank[sa[i]]=i;
 36     int k=0;
 37     for(int i=0; i<n-1; height[rank[i++]]=k){
 38         if(k) --k;
 39         for(int j=sa[rank[i]-1]; r[i+k]==r[j+k]; ++k);
 40     }
 41 }
 42
 43 int n,m,r[MAXN],belong[MAXN];
 44 bool isok(int len){
 45     int cnt=0;
 46     bool vis[111]={0};
 47     for(int i=2; i<=n; ++i){
 48         if(height[i]>=len){
 49             if(!vis[belong[sa[i]]]){
 50                 vis[belong[sa[i]]]=1;
 51                 ++cnt;
 52             }
 53             if(!vis[belong[sa[i-1]]]){
 54                 vis[belong[sa[i-1]]]=1;
 55                 ++cnt;
 56             }
 57         }else{
 58             if(cnt>(m>>1)) return 1;
 59             memset(vis,0,sizeof(vis));
 60             cnt=0;
 61         }
 62     }
 63     return 0;
 64 }
 65 void pnt(int len){
 66     int cnt=0,idx;
 67     bool vis[111]={0};
 68     for(int i=2; i<=n; ++i){
 69         if(height[i]>=len){
 70             idx=sa[i];
 71             if(!vis[belong[sa[i]]]){
 72                 vis[belong[sa[i]]]=1;
 73                 ++cnt;
 74             }
 75             if(!vis[belong[sa[i-1]]]){
 76                 vis[belong[sa[i-1]]]=1;
 77                 ++cnt;
 78             }
 79         }else{
 80             if(cnt>(m>>1)){
 81                 for(int j=0; j<len; ++j){
 82                     putchar(r[idx+j]+‘a‘-1);
 83                 }
 84                 putchar(‘\n‘);
 85             }
 86             memset(vis,0,sizeof(vis));
 87             cnt=0;
 88         }
 89     }
 90 }
 91 int main(){
 92     char s[1111];
 93     while(~scanf("%d",&m) && m){
 94         n=0;
 95         for(int i=0; i<m; ++i){
 96             scanf("%s",s);
 97             for(int j=0; s[j]; ++j){
 98                 belong[n]=i;
 99                 r[n++]=s[j]-‘a‘+1;
100             }
101             r[n++]=27+i;
102         }
103         r[--n]=0;
104         SA(r,n+1,127);
105         int l=0,r=1000;
106         while(l<r){
107             int mid=l+r+1>>1;
108             if(isok(mid)) l=mid;
109             else r=mid-1;
110         }
111         if(l==0) puts("?");
112         else pnt(l);
113         putchar(‘\n‘);
114     }
115     return 0;
116 }
时间: 2024-08-04 03:35:54

POJ3294 Life Forms(二分+后缀数组)的相关文章

[POJ3294]Life Forms(后缀数组)

传送门 统计大于一半的串中都出现过的子串,有多个按照字典序输出 二分子串长度 k,用 k 将height 数组分组,接下来直接判断就 ok. 有个小细节,平常统计所有串中都出现的最长子串时,把所有子串拼接起来的符号可以是相同的,但是这个题不行.(为什么?好好想想) ——代码 1 #include <cstdio> 2 #include <cstring> 3 #include <iostream> 4 #define N 101001 5 6 int len, n, m

POJ 3294 Life Forms(后缀数组+二分答案)

[题目链接] http://poj.org/problem?id=3294 [题目大意] 求出在至少在一半字符串中出现的最长子串. 如果有多个符合的答案,请按照字典序输出. [题解] 将所有的字符串通过不同的拼接符相连,作一次后缀数组, 二分答案的长度,然后在h数组中分组,判断是否可行, 按照sa扫描输出长度为L的答案即可.注意在一个子串中重复出现答案串的情况. [代码] #include <cstdio> #include <cstring> #include <vecto

HDU5853 Jong Hyok and String(二分 + 后缀数组)

题目 Source http://acm.hdu.edu.cn/showproblem.php?pid=5853 Description Jong Hyok loves strings. One day he gives a problem to his friend you. He writes down n strings Pi in front of you, and asks m questions. For i-th question, there is a string Qi. We

【UVA11107 训练指南】Life Forms【后缀数组】

题意 输入n(n<=100)个字符串,每个字符串长度<=1000,你的任务是找出一个最长的字符串使得超过一半的字符串都包含这个字符串. 分析 训练指南上后缀数组的一道例题,据说很经典(估计也就是height分组比较常用).但是训练指南上给出的中文题面真滴坑B啊!书上说,连续出现,我懵逼了好久! 我们把这n个字符串连成一个长的字符串S,且中间用不同的未出现的字符相隔开(为什么隔开我们后面说),比如样例一会变为abcdefg1bcdefgh2cdefghi3.这样每一段是一个原字符串.然后问题转换

【POJ3294】Life Forms(后缀数组,二分)

题意: n<=100 len[i]<=1000 思路:这是一道论文题 1 var a,x,y,sa,rank,height,wc,wd,ans,flag,b:array[0..200000]of longint; 2 ch:array[1..200]of ansistring; 3 n,n1,l,r,mid,last,i,j,m,len:longint; 4 5 procedure swap(var x,y:longint); 6 var t:longint; 7 begin 8 t:=x;

POJ 题目3294Life Forms(后缀数组求超过k个的串的最长公共子串)

Life Forms Time Limit: 5000MS   Memory Limit: 65536K Total Submissions: 11178   Accepted: 3085 Description You may have wondered why most extraterrestrial life forms resemble humans, differing by superficial traits such as height, colour, wrinkles, e

POJ3261 Milk Patterns(二分+后缀数组)

题目求最长的重复k次可重叠子串. 与POJ1743同理. 二分枚举ans判定是否成立 height分组,如果大于等于ans的组里的个数大于等于k-1,这个ans就可行 1 #include<cstdio> 2 #include<cstring> 3 #include<algorithm> 4 using namespace std; 5 #define MAXN 1000001 6 7 int wa[MAXN],wb[MAXN],wv[MAXN],ws[MAXN]; 8

UVA-11107 Life Forms(后缀数组)

题目大意:给出n个字符串,找出所有最长的在超过一半的字符串中出现的子串. 题目分析:将所有的字符串连成一个,二分枚举长度,每次用O(n)的时间复杂度判断.连接字符串的时候中间添一个没有出现过的字符. 代码如下: # include<iostream> # include<cstdio> # include<cstring> # include<algorithm> using namespace std; # define mid (l+(r-l)/2) #

UVALive - 4513 Stammering Aliens ——(hash+二分 || 后缀数组加二分)

题意:找一个出现了m次的最长子串,以及这时的最右的位置. hash的话代码还是比较好写的,,但是时间比SA多很多.. 1 #include <stdio.h> 2 #include <algorithm> 3 #include <string.h> 4 using namespace std; 5 const int N = 40000 + 100; 6 typedef long long ll; 7 const int X = 257; 8 const int mod