转载请注明出处:http://blog.csdn.net/u012860063?viewmode=contents
如果一个长度 L 字符串是由 n 个长度 L / n 子串构成的。那么最后一个字符的next值是L-L/n吧;
例如:
一个字符串:abbabbabbabbabb(一共15个字符)
next[15]=12吧!
我们拿:15 - 12 = 3 就是最长重复子串的长度
现在说一般情况:
假设 next[length] = k
如果 k % length == 0 那 length / k 就是最长重复子串长度;
如果 k 不能整除 length 那最长重复子串就是它自己了。
KMP,next[]表示模式串如果第i位(设T[0]为第0位)与文本串第j位不匹配,则要回到第next[i]位继续与文本串第j位匹配。则模式串第1位到next[n]与模式串第n-next[n]位到n位是匹配的。所以思路和上面一样,如果n%(n-next[n])==0,则存在重复连续子串,长度为n-next[n]。
例如: a b a b a b
next: -1 0 0 1 2 3 4
next[n] == 4代表着:前缀abab与后缀abab相等的最长长度,这说明,ab这两个字母为一个循环节,长度 = n-next[n];
求next[]值的代码如下:
#include<cstdio> #include<cstring> #define N 1000017 int next[N]; int len; void getnext(char T[]) { int i = 0, j = -1; next[0] = -1; while(i < len) { if(j == -1 || T[i] == T[j]) { i++; j++; next[i] = j; } else j = next[j]; } } int main() { char s[N]; while(~scanf("%s",s)) { len = strlen(s); getnext(s); for(int i = 1; i <= len; i++) { printf("%d ",next[i]); } printf("\n"); } return 0; }
实例运用见:http://blog.csdn.net/u012860063/article/details/38532507
KMP(最长重复子串 & 最小覆盖)
时间: 2024-11-05 21:54:44