KMP算法学习笔记

http://www.matrix67.com/blog/archives/115

Orz maxtix67

一直拖着到碰到了KMP算法的题才学。。

设有字符串A：abefgababef

模式串 B：abefgabef

当A与B进行匹配时，设i是A上的指针，j是B上的指针，则A和B匹配到第8位就会失配。按照常规方法，我们会将i跳回到2，j跳回到1进行匹配。观察之后我们会发现其实这是多余的，因为中间的befg都是不可能的，我们应该直接跳到A的第6位进行匹配。

KMP算法就是通过过滤这样无用字符来加快匹配速度的。。

以上面的B为例，当abefgab已经被匹配而下一位失配的时候，其实后面的ab可以直接作为新一次匹配的开头利用起来的，因为ab即是abefgab的前缀又是后缀。这为我们提供了思路，我们如果能找到已匹配字符串的最大的即是前缀又是后缀的子串（称它为前后缀好了）我们就可以直接将他放到下一次匹配中，这就减少了时间复杂度。现在的问题是如何求出模式串每一个前缀的最大的前后缀呢。。

令s[i]为模式串的第i个前缀，即前i位构成的串，p[i]为s[i]的最大前后缀长度，假设我们已知p[i]，要求p[i+1]，其实这是一个模式串的自身匹配过程。如果s[i+1]==s[p[i]+1]也就是最大前后缀作为前缀和作为后缀的下一位匹配上了，显然p[i+1]=p[i]+1；如果不相等，就退而求其次的找p[i]的最大前后缀，这样一直退下去，总有一个会匹配上，否则p[i+1]就为0。这样我们就得到了p数组，匹配的时候可以仿照求p的过程来进行。。

获取p数组：

void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}

codevs1404：

#include<iostream>
#include<cstdio>
#include<memory.h>
#define maxn 200005
char a[maxn],b[maxn];
int i,j,n,m,k,x,p[maxn],len[maxn],cnt[maxn];
void getp()
{
	j=0;p[0]=0;
	for (i=1;i<m;i++)
	{
		while (j&&b[j]!=b[i]) j=p[j-1];
		if (b[j]==b[i]) j++;
		p[i]=j;
	}
}
void match(char *a,char *b)
{
	int i,j=0;
	for (i=0;i<n;i++)
	{
		while (j&&b[j]!=a[i]) j=p[j-1];
		if (b[j]==a[i]) j++;
		cnt[j]++;
		if (j==m) j=p[j-1];
	}
}
int main()
{
	scanf("%d%d%d\n%s\n%s",&n,&m,&k,&a,&b);
	getp();
	memset(cnt,0,sizeof(cnt));
	match(a,b);
	for (i=m;i>=1;i--) cnt[p[i-1]]+=cnt[i];
	for (i=1;i<=k;i++)
	{
		scanf("%d",&x);
		printf("%d\n",cnt[x]-cnt[x+1]);
	}
}

时间： 2024-10-26 17:04:14

KMP算法学习笔记

KMP算法学习笔记的相关文章

KMP算法学习笔记

字符串匹配-KMP算法学习笔记

算法学习笔记 KMP算法之 next 数组详解

算法学习笔记递归之快速幂、斐波那契矩阵加速

EM算法学习笔记2：深入理解

算法学习笔记最短路

[算法学习笔记]直接插入排序笔记

八大排序算法学习笔记：冒泡排序

由LCS到编辑距离—动态规划入门—算法学习笔记