【转载】字符串最小表示法-O(n)算法

原博客链接:http://blog.csdn.net/zy691357966/article/details/39854359

未授权,侵权删。

因为这篇博客写得真好。。转载了。。

红色的字是原博主写的,蓝色的字是我加的。

---------------------------------------------------------------------------------------------------------------------------------------------------------

这篇文章里的p1就是i,p2就是j

网上看了这篇文章后还是感觉有些地方讲的没有详细的证明所以添加了一点 红色字是博主写的

求字符串的循环最小表示:

上面说的两个字符串同构的,并没有直接先求出Min(s),而是通过指针移动,当某次匹配串长时,那个位置就是Min(s)。而这里的问题就是:不是给定两个串,而是给出一个串,求它的Min(s),eg:Min(“babba”) = 4。那么由于这里并非要求两个串的同构,而是直接求它的最小表示,由于源串和目标串相同,所以处理起来既容易又需要有一些变化:我们仍然设置两个指针,i, j,其中i指向0,j指向1,仍然采用上面的滑动方式:

(1)  利用两个指针i, j。初始化时i指向0, j指向1。

(2)  k = 0开始,检验s[i+k] 与 s[j+k] 对应的字符是否相等,如果相等则k++,一直下去,直到找到第一个不同,(若k试了一个字符串的长度也没找到不同,则那个位置就是最小表示位置,算法终止并返回)。则该过程中,s[i+k] 与 s[j+k]的大小关系,有三种情况:

证明的时候假设(i<j)的,无伤大雅 ;

(A). s[i+k] > s[j+k],则i滑动到i+k+1处 --- 即s1[i->i+k]不会是该循环字符串的“最小表示”的前缀。

证明如下

(B). s[i+k] < s[j+k],则j滑动到j+k+1处,原因同上。

证明如下

(C). s[i+k] = s[j+k],则 k++; if (k == len) 返回结果。

注:这里滑动方式有个小细节,若滑动后i == j,将正在变化的那个指针再+1。直到p1、p2把整个字符串都检验完毕,返回两者中小于len 的值。(这里的字符串是从0开始的,所以末位是len-1)

(3)   如果 k == len, 则返回i与j中的最小值

如果 i >= len   则返回j(从1开始 : i>=len+1)

如果 j >= len   则返回i (从1开始: j>=len+1)

如果看了上一篇文章 很容易对这里的i,j 产生误会  误以为i为ans,j为比较指针

实际上这题中 i,j 都可能存有ans 两者互相更新,直到有一个更新后超过了len(包括len) 的时候 另一个即为正解

(4)   进一步的优化,例如:i要移到i+k+1时,如果i+k+1 <= p2的话,可以直接把i移到 j+1,因为,j到j+k已经检验过了该前缀比以i到i+k之间任何一个位前缀都小;j时的类似,移动到i+1。

这个优化就无需解释了

如i移到i+k+1,且i+k+1<=j,则j在i的后面,设j前一次位置为j‘,每一次跳的时候都保证了j‘~j-1这一段任意一个字符开始的子串都不可能,又因为j本来等于i+1,就是i+1到j-1这一段都不可能,所以现在可以直接跳了。

至此,求一个字符串的循环最小表示在O(n)时间实现,感谢大牛的论文。其中实现时的小细节“如果滑动后p1 == p2,将正在变化的那个指针再+1”,开始没有考虑,害得我想了几个小时都觉得无法进行正确的移动。具体例题有两个:http://acm.zju.edu.cn 的2006和1729题。一个是10000规模一个是100000规模。运行时间前者是0S,后者是0.05S。

上自己丑陋的代码

 1 int MinimumRepresentation(int *s, int l)
 2 {
 3     int i,j,k;
 4     i=0;j=1;k=0;
 5     while(i<l&&j<l)
 6     {
 7         k=0;
 8         while(s[i+k]==s[j+k]&&k<l) k++;
 9         if(k==l) return i;
10         if(s[i+k]>s[j+k])
11          if(i+k+1>j) i=i+k+1;
12          else i=j+1;
13         else if(j+k+1>i) j=j+k+1;
14         else  j=i+1;
15     }
16     if(i<l) return i;
17     else return j;
18 } 

我也附上我的代码:

 1 int Min()
 2 {
 3     int i=1,j=2,k;
 4     while(i<=sl && j<=sl)
 5     {
 6         k=0;//debug 每次清零!
 7         while(s[i+k]==s[j+k] && k<sl)//debug
 8         {
 9             k++;
10             if(k==sl) return minn(i,j);
11         }
12         if(s[i+k]>s[j+k])
13         {
14             if(i+k+1<=j) i=j+1;
15             else i=i+k+1;
16         }
17         else
18         {
19             if(j+k+1<=i) j=i+1;
20             else j=j+k+1;
21         }
22
23     }
24     if(i<=sl) return i;
25     if(j<=sl) return j;
26 }
27
28 int Max()
29 {
30     int i=1,j=2,k;
31     while(i<=sl && j<=sl)
32     {
33         k=0;
34         while(s[i+k]==s[j+k] && k<sl)//debug k<sl
35         {
36             k++;
37             if(k==sl) return minn(i,j);
38         }
39         if(s[i+k]<s[j+k])
40         {
41             if(i+k+1<=j) i=j+1;
42             else i=i+k+1;
43         }
44         else
45         {
46             if(j+k+1<=i) j=i+1;
47             else j=j+k+1;
48         }
49     }
50     if(i<=sl) return i;
51     if(j<=sl) return j;
52 }
时间: 2024-10-13 07:40:02

【转载】字符串最小表示法-O(n)算法的相关文章

[coj 1353 Guessing the Number]kmp,字符串最小表示法

题意:给一个字符串,求它的最小子串,使得原串是通过它重复得到的字符串的一个子串. 思路:先求最小长度,最小循环长度可以利用kmp的next数组快速得到,求出长度后然后利用字符串最小表示法求循环节的最小表示即可. #pragma comment(linker, "/STACK:10240000") #include <map> #include <set> #include <cmath> #include <ctime> #include

没有来源的题(似乎是什么POI?) 字符串——最小表示法

[题目描述]? 给你两个长度为 \(n\) 的字符串,问能否通过将某一字符串的一个前缀接到该串的后面使得两个字符串相等.若可以,你还可能被要求输出通过上述操作所能得到的字典序最小的字符串. [输入格式] ? ? 第一行两个整数 \(n,T\). ? 接下来两行,每行一个长度为 \(n\) 的字符串. [输出格式] ? 若可以,输出 \(TAK\),否则输出 \(NIE\).如果 \(T=1\),你还需要在下一行输出字典序最小的字符串. [数据范围] \(n \le 1000000\) 首先,什么

hdu 2609 字符串最小表示法 虽然不是很懂 还是先贴上来吧。/,。/

还需要再消化一下这个算法.. 今天没有时间了,, 六级过了 就有大把时间 快活啊!#include<iostream> #include<cstdio> #include<cstring> #include<string> #include<set> using namespace std; int getmin(string s) { int n=s.size(); int i=0,j=1,k=0,t; while(i<n &&a

Vijos 有根树的同构问题【字符串---最小表示法】

背景 经典题 描述 所谓图的同构是指两个图“相同”.图的同构有着广泛的应用,比如当要对一批图施行某种操作的时候,如果能发现其中有一些图是同构的,就可以在这些同构的图中只保留一个,从而降低工作量.例如,图1所示的T1和T3就是同构的. 图的同构的定义:给出两个图G1=(V1,E1),G2=(V2,E2).如果存在一个V1到V2的一一映射f,使得(x,y)是G1的边,当且仅当(f(x),f(y))是G2的边,则称G1和G2是同构的.也就是说,我们只关心顶点间的拓扑关系而不关心顶点的编号. 任意图的同

字符串最小表示法模版

1 //O(n) 2 char s[N],ss[N*2]; 3 int n=strlen(s+1); 4 for(int i=1;i<=n;i++) 5 ss[i+n]=s[i]; 6 int i=1,j=2,k; 7 while(i<=n && j<=n){ 8 for(k=0;k<n && s[i+k] == s[j+k]; k++); 9 if(k==n) break; 10 if(s[i+k]>s[j+k]){ 11 i=i+k+1;

字符串最小表示法 O(N)

#include<iostream> #include<stdio.h> #include<cstring> #define rep(i,n) for(int i=0;i<n;i++) #define sf scanf #define pf printf using namespace std; int MinimumRepresentation(char *s, int l) { int i = 0, j = 1, k = 0, t; while(i <

2018/2/24 每日一学 字符串最小表示法

非常简单,直接上代码: int minimalRepresentation() { int n = strlen(str); int i = 0,j = 1, k = 0; while(i<n && j<n && k<n) { int t = str[(i+k)%n] - str[(j+k)%n] ; if(t == 0) k++; else { if(t>0) i+=k+1; else j+=k+1; if(i==j) j++; k = 0; }

字符串最小表示法

第一种 int get_minstring(char s[]) { int n =strlen(s); int i = 0, j = 1, k; while (i < n&&j < n) { for (k = 0; k < n&&s[(j + k) % n] == s[(i + k) % n]; k++); if (k == n) break; if (s[(i + k)%n]>s[(j + k)%n]) { i = i + k + 1; if (i

【算法】字符串的最小表示法

字符串的最小表示法,就是对于一个字符串,可以将它的最后一位放到第一位来,依次类推,一共有n种变形,n为字符串长度 例如: s="00ab" 变形有(省略引号)b00a ab00 0ab0 一共4种 那么找到其中字典序最小的一个,用的算法便是这个. 定义三个指针,i,j,k 初始i=0;j=1;k=0 首先,如果s[i]<s[j]那么很明显j++ 如果s[i]>s[j]那么也很明显i=j++ 省下的就是如果s[i]==s[j]的时候. 这时候有一个性质就是在i和j之间的所有的