【POJ 3693】Maximum repetition substring 重复次数最多的连续重复子串

后缀数组的论文里的例题,论文里的题解并没有看懂,,,

求一个重复次数最多的连续重复子串,又因为要找最靠前的,所以扫的时候记录最大的重复次数为$ans$,扫完后再后从头暴力扫到尾找重复次数为$ans$的第一个子串的开头,break输出就可以了

#include<cmath>
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
const int N = 100003;

int t1[N], t2[N], c[N];
void st(int *x, int *y, int *sa, int n, int m) {
	int i;
	for(i = 0; i < m; ++i) c[i] = 0;
	for(i = 0; i < n; ++i) ++c[x[y[i]]];
	for(i = 1; i < m; ++i) c[i] += c[i - 1];
	for(i = n - 1; i >= 0; --i) sa[--c[x[y[i]]]] = y[i];
}
void mkhz(int *a, int *sa, int n, int m) {
	int *x = t1, *y = t2, *t, i, j, p;
	for(i = 0; i < n; ++i) x[i] = a[i], y[i] = i;
	st(x, y, sa, n, m);
	for(p = 1, j = 1; p < n; j <<= 1, m = p) {
		for(p = 0, i = n - j; i < n; ++i) y[p++] = i;
		for(i = 0; i < n; ++i) if (sa[i] >= j) y[p++] = sa[i] - j;
		st(x, y, sa, n, m);
		for(t = x, x = y, y = t, p = 1, x[sa[0]] = 0, i = 1; i < n; ++i)
			x[sa[i]] = y[sa[i]] == y[sa[i - 1]] && y[sa[i] + j] == y[sa[i - 1] + j] ? p - 1 : p++;
	}
}
void mkh(int *r, int *sa, int *rank, int *h, int n) {
	int i, j, k = 0;
	for(i = 1; i <= n; ++i) rank[sa[i]] = i;
	for(i = 1; i <= n; h[rank[i++]] = k)
		for(k ? --k : 0, j = sa[rank[i] - 1]; r[i + k] == r[j + k]; ++k);
}

char s[N];
int a[N], rank[N], sa[N], h[N], n, pro = 0, f[N][30], ans, cnt, aa[N];
void mkst() {
	for(int i = 1; i <= n; ++i)
		f[i][0] = h[i];
	int k = floor(log((double)n) / log(2.0));
	for(int j = 1; j <= k; ++j)
		for(int i = 1; i <= n; ++i) {
			if (i + (1 << j) - 1 > n) break;
			f[i][j] = min(f[i][j - 1], f[i + (1 << (j - 1))][j - 1]);
		}
}
int Q(int l, int r) {
	l = rank[l]; r = rank[r];
	if (l > r) swap(l, r); ++l;
	int k = floor(log((double)(r - l + 1)) / log(2.0));
	return min(f[l][k], f[r - (1 << k) + 1][k]);
}
int main() {
	while (scanf("%s", s + 1), s[1] != ‘#‘) {
		printf("Case %d: ", ++pro);
		n = strlen(s + 1);
		for(int i = 1; i <= n; ++i) a[i] = s[i];
		mkhz(a, sa, n + 1, 130);
		mkh(a, sa, rank, h, n);
		mkst();
		ans = 0, cnt = 0;
		for(int l = 1; l < n; ++l)
			for(int i = 1; i <= n - l; i += l) {
				int k = Q(i, i + l);
				int now = k / l + 1;
				int to = i - (l - k % l);
				if (to > 0 && k % l)
					if (Q(to, to + l) >= now) ++now;
				if (now > ans) {
					aa[cnt = 1] = l;
					ans = now;
				} else if (now == ans) {
					aa[++cnt] = l;
				}
			}
		int to = 0, len = 0;
		for(int i = 1; i <= n; ++i)
			for(int j = 1; j <= cnt; ++j) {
				int k = Q(sa[i], sa[i] + aa[j]);
				if (k >= (ans - 1) * aa[j]) {
					to = sa[i];
					len = ans * aa[j];
					i = n;
					break;
				}
			}
		for(int i = to; i < to + len; ++i)
			putchar(s[i]);
		puts("");
	}
	return 0;
}

终于A了233

时间: 2024-10-04 04:21:44

【POJ 3693】Maximum repetition substring 重复次数最多的连续重复子串的相关文章

POJ 3693 Maximum repetition substring(后缀数组求最长重复子串)

题目大意:和spoj687类似,就是当长度相同是需要输出一个最小的字典序的序列. 解体思路:这次需要枚举所有的从i到d = i-L/i (d = i-L%i)的位置,然后记录保证最大值的同时,求出来字典序最小的. Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 7418   Accepted: 2217 Description The repetition numb

POJ 3693 Maximum repetition substring (寻找重复次数最多的连续子串)

Maximum repetition substring Time Limit: 1000MS   Memory Limit: 65536K Total Submissions: 9083   Accepted: 2782 Description The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same conse

POJ - 3693 Maximum repetition substring(后缀数组求重复次数最多的连续重复子串)

Description The repetition number of a string is defined as the maximum number R such that the string can be partitioned into R same consecutive substrings. For example, the repetition number of "ababab" is 3 and "ababa" is 1. Given a

POJ 3693 Maximum repetition substring (后缀数组)

题目大意: 求出字典序最小,重复次数最多,的子串. 思路分析: RMQ + height 数组可以求出任意两个后缀的lcp 我们枚举答案字符串的重复的长度. 如果这个字符串的长度为 l ,而且这个字符串出现过两次或两次以上 那么你会发现在原串中  str[0] str[l] str[2*l] ....肯定有相邻的两个被包含在重复的串中. 我们求出这两个相邻的后缀的lcp 我们上面仅仅说的是被包含在重复的串中,但并不一定就是以 str[0], str[l],str[2*l]....为起点的. 那我

POJ 3693 Maximum repetition substring(后缀数组神题)

POJ 3693 Maximum repetition substring 题目链接 题意:给定一个字符串,求出其子串中,重复次数最多的串,如果有相同的,输出字典序最小的 思路:枚举长度l,把字符串按l分段,这样对于长度为l的字符串,肯定会包含一个分段位置,这样一来就可以在每个分段位置,往后做一次lcp,求出最大匹配长度,然后如果匹配长度有剩余,看剩余多少,就往前多少位置再做一次lcp,如果匹配出来长度更长,匹配次数就加1,这样就可以枚举过程中保存下答案了 这样问题还有字典序的问题,这个完全可以

poj 3693 Maximum repetition substring(后缀数组)

题目链接:poj 3693 Maximum repetition substring 题目大意:求一个字符串中循环子串次数最多的子串. 解题思路:对字符串构建后缀数组,然后枚举循环长度,分区间确定.对于一个长度l,每次求出i和i+l的LCP,那么以i为起点,循环子串长度为l的子串的循环次数为LCP/l+1,然后再考虑一下从i-l+1~i之间有没有存在增长的可能性. #include <cstdio> #include <cstring> #include <vector>

poj 3693 Maximum repetition substring(08合肥 RMQ+后缀数组)

传送门:http://poj.org/problem?id=3693 题目:给出一个串,求重复次数最多的连续重复子串: 分析: 枚举重复单元的长度,然后理所当然的枚举起点.利用rmq处理,后缀i,i+l的最长前缀. lcp/l+1,为当前相邻l长度单元的串的重复次数,但是由于i+=l,提高了效率,但是i不一定刚好是重复串的起点,所以如果r%l!=0,把串往前移l-r%l个单位.找到最大的重复次数,然后利用sa数组的排名(1-n),,可以字典序输出. 详细链接:http://blog.csdn.n

后缀数组 POJ 3693 Maximum repetition substring

题目链接 题意:给定一个字符串,求重复次数最多的连续重复子串. 分析:(论文上的分析)先穷举长度 L,然后求长度为 L 的子串最多能连续出现几次.首先连续出现 1 次是肯定可以的,所以这里只考虑至少 2 次的情况.假设在原字符串中连续出 现 2 次,记这个子字符串为 S,那么 S 肯定包括了字符 r[0], r[L], r[L*2], r[L*3], ……中的某相邻的两个.所以只须看字符 r[L*i]和 r[L*(i+1)]往前和 往后各能匹配到多远,记这个总长度为 K,那么这里连续出现了 K/

spoj687 后缀数组重复次数最多的连续重复子串

REPEATS - Repeats no tags A string s is called an (k,l)-repeat if s is obtained by concatenating k>=1 times some seed string t with length l>=1. For example, the string s = abaabaabaaba is a (4,3)-repeat with t = aba as its seed string. That is, the