【POJ3693】Maximum repetition substring (SA)

这是一道神奇的题目..论文里面说得不清楚,其实是这样...如果一个长度为l的串重复多次,那么至少s[1],s[l+1],s[2*l+1],..之中有相邻2个相等...设这时为j=i*l+1,k=j+l,我们这时候借助SA和RMQ  O(1)求出:m=lcp(j,k),这时候,重复次数至少ans=m div l+1 。  当然,我们枚举到不一定能够是最优啊,因为你枚举的不一定是字符串的首尾..那这时候怎么办?就是论文里面说的,向前和向后匹配。我们设t=l-m mod l..可以理解为,这时候 m mod l为多出来的字符,t就看成是前面少的字符个数..当然如果m mod l=0就不用管这个了...那也就是说,我们再判断是否lcp(j-t,k-t)>=l   如果成立,那么 ans++ ...因为可以多出一段..

上面就解决了求最长的问题,下面将关于字典序的这个...其实SA就是字典序了,只要枚举是否 lcp(sa[i],sa[i]+l)>=(ans-1)*l,若成立,显然当前sa[i]起始长度为l的字符串就是答案...

嗯..写完顿时觉得涨姿势了..

const maxn=100419;
var
 rec,c,h,rank,sa,x,y:array[0..maxn] of longint;
 f:array[0..maxn,0..20] of longint;
 n,cas:longint;
 s:ansistring;

function max(x,y:longint):longint; begin if x>y then exit(x) else exit(y); end;
function min(x,y:longint):longint; begin if x<y then exit(x) else exit(y); end;
procedure swap(var x,y:longint); var tmp:longint; begin tmp:=x;x:=y;y:=tmp; end;

procedure make;
var p,i,tot:longint;
begin
 p:=1;
 while p<n do
  begin
   fillchar(c,sizeof(c),0);
   for i:= 1 to n-p do y[i]:=rank[i+p];
   for i:= n-p+1 to n do y[i]:=0;
   for i:= 1 to n do inc(c[y[i]]);
   for i:= 1 to n do inc(c[i],c[i-1]);
   for i:= 1 to n do
    begin
     sa[c[y[i]]]:=i;
     dec(c[y[i]]);
    end;
   fillchar(c,sizeof(c),0);
   for i:= 1 to n do x[i]:=rank[i];
   for i:= 1 to n do inc(c[x[i]]);
   for i:= 1 to n do inc(c[i],c[i-1]);
   for i:= n downto 1 do
    begin
     y[sa[i]]:=c[x[sa[i]]];
     dec(c[x[sa[i]]]);
    end;
   for i:= 1 to n do sa[y[i]]:=i;
   tot:=1;
   rank[sa[1]]:=1;
   for i:= 2 to n do
    begin
     if (x[sa[i]]<>x[sa[i-1]]) or (x[sa[i]+p]<>x[sa[i-1]+p]) then inc(tot);
     rank[sa[i]]:=tot;
    end;
   p:=p<<1;
  end;
 for i:= 1 to n do sa[rank[i]]:=i;
end;

procedure makeh;
var i,j,p:longint;
begin
 h[1]:=0; p:=0;
 for i:= 1 to n do
  begin
   p:=max(p-1,0);
   if rank[i]=1 then continue;
   j:=sa[rank[i]-1];
   while (i+p<=n) and (j+p<=n) and (s[i+p]=s[j+p]) do inc(p);
   h[rank[i]]:=p;
  end;
end;

procedure rmq;
var i,j:longint;
begin
 for i:= 1 to n do f[i,0]:=h[i];
 for i:= 1 to trunc(ln(n)/ln(2)) do
  for j:= 1 to n-1<<i+1 do
   f[j,i]:=min(f[j,i-1],f[j+1<<(i-1),i-1]);
end;

procedure init;
var i,tot:longint;
begin
 n:=length(s);
 for i:= 1 to n do x[i]:=ord(s[i]);
 fillchar(c,sizeof(c),0);
 for i:= 1 to n do inc(c[x[i]]);
 for i:= 1 to 128 do inc(c[i],c[i-1]);
 for i:= 1 to n do
  begin
   sa[c[x[i]]]:=i;
   dec(c[x[i]]);
  end;
 rank[sa[1]]:=1;
 tot:=1;
 for i:= 2 to n do
  begin
   if x[sa[i]]<>x[sa[i-1]] then inc(tot);
   rank[sa[i]]:=tot;
  end;
 make;
 makeh;
 rmq;
end;

function lcp(x,y:longint):longint;
var t:longint;
begin
 x:=rank[x]; y:=rank[y];
 if x>y then swap(x,y);
 if x<y then inc(x);
 t:=trunc(ln(y-x+1)/ln(2));
 exit(min(f[x,t],f[y-1<<t+1,t]));
end;

procedure solve;
var m,l,i,j,tmp,t,ans,cnt:longint;
 pd:boolean;
begin
 init;
 fillchar(rec,sizeof(rec),0);
 ans:=0;
 for l:= 1 to n-1 do
  begin
   i:=1;
   while i+l<=n do
    begin
     m:=lcp(i,i+l);
     tmp:=m div l+1;
     t:=l-m mod l;
     t:=i-t;
     if (t>0) and (m mod l<>0) and (lcp(t,t+l)>=m) then inc(tmp);
     if tmp>ans then
      begin
       cnt:=1;
       rec[1]:=l;
       ans:=tmp;
      end;
     if cnt=ans then
      begin
       inc(cnt);
       rec[cnt]:=l;
      end;
     i:=i+l;
    end;
  end;
 pd:=false;
 for i:= 1 to n do
  if not pd then
   for j:= 1 to cnt do
    begin
     l:=rec[j];
     if lcp(sa[i],sa[i]+l)>=(ans-1)*l then
      begin
       t:=sa[i];
       l:=l*ans;
       pd:=true;
       break;
      end;
    end
  else break;
 inc(cas);
 write(‘Case ‘,cas,‘: ‘);
 for i:= t to t+l-1 do write(s[i]);
 writeln;
end;

Begin
 cas:=0;
 readln(s);
 while s[1]<>‘#‘ do
  begin
   solve;
   readln(s);
  end;
End.
时间: 2024-12-18 12:36:47

【POJ3693】Maximum repetition substring (SA)的相关文章

【poj3693】Maximum repetition substring(后缀数组+RMQ)

自己看着大牛的论文学了一下后缀数组,看了好久好久,想了好久好久才懂了一点点皮毛TAT 然后就去刷传说中的后缀数组神题,poj3693是进化版的,需要那个相同情况下字典序最小,搞这个搞了超久的说. 先简单说一下后缀数组.首先有几个重要的数组: ·SA数组(后缀数组):保存所有后缀排序后从小到大的序列.[即SA[i]=j表示排名第i的后缀编号为j]        ·rank数组(名次数组):记录后缀的名次.[即rank[i]=j表示编号为i的后缀排名第j] 用倍增算法可以在O(nlogn)时间内得出

【POJ3693】Maximum repetition substring 后缀数组恶心题

转载请注明出处:http://blog.csdn.net/vmurder/article/details/42677359 其实我就是觉得原创的访问量比未授权盗版多有点不爽233... 题意: 给一个字符串,然后找一个子串,使子串满足其中连续重复子串最多. 比如ababab,重复次数为3,ababa,重复次数为1(abab是两次) 恶心在于还要输出最小字典序. 题解网上都有,不发了. 代码: <span style="font-family:KaiTi_GB2312;font-size:1

【POJ 3693】Maximum repetition substring 重复次数最多的连续重复子串

后缀数组的论文里的例题,论文里的题解并没有看懂,,, 求一个重复次数最多的连续重复子串,又因为要找最靠前的,所以扫的时候记录最大的重复次数为$ans$,扫完后再后从头暴力扫到尾找重复次数为$ans$的第一个子串的开头,break输出就可以了 #include<cmath> #include<cstdio> #include<cstring> #include<algorithm> using namespace std; const int N = 1000

poj3693 Maximum repetition substring 后缀数组

http://poj.org/problem?id=3693 Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7241   Accepted: 2162 Description The repetition number of a string is defined as the maximum number R such that the string can b

poj 3693 Maximum repetition substring(后缀数组)

题目链接:poj 3693 Maximum repetition substring 题目大意:求一个字符串中循环子串次数最多的子串. 解题思路:对字符串构建后缀数组,然后枚举循环长度,分区间确定.对于一个长度l,每次求出i和i+l的LCP,那么以i为起点,循环子串长度为l的子串的循环次数为LCP/l+1,然后再考虑一下从i-l+1~i之间有没有存在增长的可能性. #include <cstdio> #include <cstring> #include <vector>

POJ 3693 Maximum repetition substring (后缀数组)

题目大意: 求出字典序最小,重复次数最多,的子串. 思路分析: RMQ + height 数组可以求出任意两个后缀的lcp 我们枚举答案字符串的重复的长度. 如果这个字符串的长度为 l ,而且这个字符串出现过两次或两次以上 那么你会发现在原串中  str[0] str[l] str[2*l] ....肯定有相邻的两个被包含在重复的串中. 我们求出这两个相邻的后缀的lcp 我们上面仅仅说的是被包含在重复的串中,但并不一定就是以 str[0], str[l],str[2*l]....为起点的. 那我

Maximum repetition substring 后缀数组

Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7578   Accepted: 2281 Description The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same conse

POJ 3693 Maximum repetition substring(后缀数组神题)

POJ 3693 Maximum repetition substring 题目链接 题意:给定一个字符串,求出其子串中,重复次数最多的串,如果有相同的,输出字典序最小的 思路:枚举长度l,把字符串按l分段,这样对于长度为l的字符串,肯定会包含一个分段位置,这样一来就可以在每个分段位置,往后做一次lcp,求出最大匹配长度,然后如果匹配长度有剩余,看剩余多少,就往前多少位置再做一次lcp,如果匹配出来长度更长,匹配次数就加1,这样就可以枚举过程中保存下答案了 这样问题还有字典序的问题,这个完全可以

POJ 3693 Maximum repetition substring (寻找重复次数最多的连续子串)

Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9083   Accepted: 2782 Description The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same conse