数据结构与算法之KMP算法

串的模式匹配算法

子串(模式串)的定位操作通常称为串的模式匹配。

这是串的一种重要操作,很多 软件,若有“编辑”菜单项的话, 则其中必有“查找”子菜单项。

串的顺序存储实现

#include<stdio.h>
#include<string.h>
#define MaxLen 256  /*定义能处理的最大的串长度*/
typedef struct {
    char str[MaxLen];
    int  curlen;  /*定义当前实际串长度*/
}SString; 

BF算法设计思想:

  • 将主串的第pos个字符和模式的第1个字符比较, 若相等,继续逐个比较后续字符; 若不等,从主串的下一字符(pos+1)起,重新与第一个字符比较。
  • 直到主串的一个连续子串字符序列与模式相等 。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。
  • 否则,匹配失败,返回值 0
int Index(SString *s,SString *t)
{ * 返回子串t在主串s中的位置。若不存在,则函数值为-1*/
   int i,j;  i=0; j=0;
   while(i<s->curlen &&j<t->curlen) {
       if(s->str[i]==t->str[j])
       {  i++; j++;  }
       else /* 指针后退重新开始匹配 */
       {  i=i-j+1; j=0;  }
     }
     if(j>=t->curlen)
         return i-t->curlen+1;
     else
         return -1;
} 

若n为主串长度,m为子串长度,则串的BF匹配算法最坏的情况下需要比较字符的总次数为:

最恶劣情况是:主串前面n-m个位置都部分匹配到子串的最后一位,即这n-m位比较了m次.

但一般情况下BF算法的时间复杂度为O(n+m)

模式匹配的一种改进算法——KMP

KMP算法的基本思想:每一趟匹配完成后,利用上一趟匹配的结果,将模式向右滑动尽可能远的一段距离。

其方法是:不回溯指针i,找出主串中第i个字符应和模式串的第几个字符比较。

显然next[j]只与模式串有关,与主串无关

KMP算法实现

int Index_KMP(SString *s, SString *t)
{
   int next[100],i=0,j=0,v;
   getnext(t,next);/*先求得模式串的next函数值*/
   while(i<s->curlen && j<t->curlen){
      if(j==-1 || s->str[i]==t->str[j])
      { i++; j++;}
      else j=next[j]; /*i不变,j回退*/
   }
   if(j>=t->curlen)
       v=i-t->curlen+1; /*匹配成功*/
   else
       v=-1;   /*匹配失败*/
   return v;
}

求next:

void getnext(SString *t, int *next)
{  /*串t即作为目标串又作为模式串*/
    int j,k;
    j=0;k=-1;next[0]=-1;
    while(j<t->curlen-1)  {
       if(k==-1||t->str[j]==t->str[k]) {
          j++;k++;
          if(t->str[j]!=t->str[k])
              next[j]=k;
          else
              next[j]=next[k];
       }
       else k=next[k];
    }
}

原文地址:https://www.cnblogs.com/lisen10/p/10850063.html

时间: 2024-10-05 03:09:58

数据结构与算法之KMP算法的相关文章

BF算法与KMP算法

BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符:若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果. BF算法实现: 1 int BF(char S[],char T[],int pos) 2 {//c从第pos位开始搜索匹配 3 int i=pos,j=0; 4 while(S[i+j]!='\0'&&T[j]!='\0')

字符串匹配——朴素算法、KMP算法

字符串匹配(string match)是在实际工程中经常会碰到的问题,通常其输入是原字符串(String)和子串(又称模式,Pattern)组成,输出为子串在原字符串中的首次出现的位置.通常精确的字符串搜索算法包括朴素搜索算法,KMP, BM(Boyer Moore), sunday, robin-karp 以及 bitap.下面分析朴素搜索算法和KMP这两种方法并给出其实现.假设原字符T串长度N,子串P长度为M. 1.NAIVE-STRING-MATCHING. 朴素算法,该方法又称暴力搜索,

KMP算法及KMP算法的应用(POJ2406)

///KMP算法#include<bits/stdc++.h> using namespace std; int Next[1000]; void makeNext(const char P[],int next[]) { int q,k; int len=strlen(P); next[0]=0; for(q=1,k=0;q<len;q++) { while(k>0&&P[q]!=P[k]) { k=next[k-1]; } if(P[q]==P[k]) { k+

什么是KMP算法?KMP算法推导

花了大概3天时间,了解,理解,推理KMP算法,这里做一次总结!希望能给看到的人带来帮助!! 1.什么是KMP算法? 在主串Str中查找模式串Pattern的方法中,有一种方式叫KMP算法 KMP算法是在模式串字符与主串字符匹配失配时,利用已经匹配的模式串字符子集的最大块对称性,让模式串尽量后移的算法. 这里有3个概念:失配,已经匹配的模式串子集,块对称性 失配和隐含信息 在模式串的字符与主串字符比较的过程中,字符相等就是匹配,字符不等就是失配: 隐含信息是,失配之前,都是匹配. 在主串S[0,1

串、串的模式匹配算法(子串查找)BF算法、KMP算法

串的定长顺序存储#define MAXSTRLEN 255,//超出这个长度则超出部分被舍去,称为截断 串的模式匹配: 串的定义:0个或多个字符组成的有限序列S = 'a1a2a3--.an ' n = 0时为空串串的顺序存储结构:字符数组,串的长度就是数组末尾'\0'前面的字符个数数组需在定义时确定长度,有局限性数组的最大长度二:串的堆分配存储表示typedef struct { char *ch; //若是非空串,则按串长分配存储区 //否则ch为空 int length; //串长度}HS

算法:KMP算法

#include <iostream> #include <malloc.h> #include <string.h> using namespace std; void CreateNext(int a[],char *str) { int n = strlen(str); a[0]=0; int flags = 0; for(int i=1;i<n;i++) { if(str[i]==str[flags]) { a[i]+=a[i-1]+1; flags++;

跳跃表,字典树(单词查找树,Trie树),后缀树,KMP算法,AC 自动机相关算法原理详细汇总

第一部分:跳跃表 本文将总结一种数据结构:跳跃表.前半部分跳跃表性质和操作的介绍直接摘自<让算法的效率跳起来--浅谈"跳跃表"的相关操作及其应用>上海市华东师范大学第二附属中学 魏冉.之后将附上跳跃表的源代码,以及本人对其的了解.难免有错误之处,希望指正,共同进步.谢谢. 跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找.插入.删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领.而且最重要的一点,就是它的编程复杂度较同类

字符串模式匹配KMP算法中的next数组算法及C++实现

一.问题描述: 对于两个字符串S.T,找到T在S中第一次出现的起始位置,若T未在S中出现,则返回-1. 二.输入描述: 两个字符串S.T. 三.输出描述: 字符串T在S中第一次出现的起始位置,若未出现,则返回-1. 四.输入例子: ababaababcbababc 五.输出例子: 5 六.KMP算法解析: KMP算法分为两步,第一步是计算next数组,第二步是根据next数组通过较节省的方式回溯来比较两个字符串. 网络上不同文章关于next数组的角标含义略有差别,这里取参考文献中王红梅<数据结构

KMP算法具体解释(转)

作者:July. 出处:http://blog.csdn.net/v_JULY_v/. 引记 此前一天,一位MS的朋友邀我一起去与他讨论高速排序,红黑树,字典树,B树.后缀树,包含KMP算法,只有在解说KMP算法的时候,言语磕磕碰碰,我想,原因有二:1.博客内的东西不常回想,忘了不少:2.便是我对KMP算法的理解还不够彻底,自不用说解说自如,运用自如了.所以,特再写本篇文章.因为此前,个人已经写过关于KMP算法的两篇文章,所以,本文名为:KMP算法之总结篇. 本文分为例如以下六个部分: 第一部分