字符串匹配算法KMP算法

数据结构中讲到关于字符串匹配算法时,提到朴素匹配算法,和KMP匹配算法。

朴素匹配算法就是简单的一个一个匹配字符,如果遇到不匹配字符那么就在源字符串中迭代下一个位置一个一个的匹配,这样计算起来会有很多多余的不符合的匹配做了冗余的比较。假设源字符串长n,字串长m 该算法最差时间复杂度为 m*(n-m+1),记为O(n*m);这里不做过多解释朴素匹配算法。

KMP算法:

kmp算法不是在源字符串中下手,他是从字串下手,比如我要在源字符串(acabaabaabcacaabc)中匹配一个字符串字串(abaabcac),那么从字串abaabcac下手,分析字串时,需要借助于一个数组存储字串中存在头字串和尾字串对称相等的子串长度,例如 abaabcac,

a  next[0] = -1,规定第一个字符对应的next值为-1;

ab next[1] = 0; 因为针对字符b而言,其前边字符串a 不存在头字串和尾字串对称,所以为0;

aba next[2]=0 ; 因为针对子串 ab ,不存在头字串和尾字串对称,所以为0;

abaa next[3]=1 ; 因为针对子串aba ,存在 头子串a和尾子串a对称相等,其长度为1,所以为1;

abaab next[4]=1; 因为针对子串abaa ,存在 头子串a和尾子串a对称相等,其长度为1,所以为1;

abaabc next[5]=2; 因为针对子串abaab ,存在 头子串ab和尾子串ab对称相等,其长度为2,所以为2;

abaabca next[5]=0; 因为针对子串abaab ,,不存在头字串和尾字串对称,所以为0;

abaabcac next[6]=1; 因为针对子串abaabca,存在 头子串a和尾子串a对称相等,其长度为1,所以为1;

总结起来如下:

  

J            0    1    2    3    4    5    6    7
P            a    b    a    a    b    c    a    c
next(j)      -1    0    0    1    1    2    0    1

获取next数组的代码如下

//获取模式匹配字符串的next数组
void getNext(char *str,char *next)
{
    int j = 0;
    int k = -1;
    int length = strlen(str);
    next[0] = -1;
    while(j<length)
    {
        if(k == -1 || str[j] == str[k])
        {
            j++;
            k++;
            next[j] = k;
        }else k = next[k];
    }
}

然后在匹配的过程中,如果遇到不匹配现象时,从不匹配位置分析,其next[i]的值标记着有n个头子串和尾子串相等,即直接从next[i]的值为下标开始寻找匹配。复杂度为O(m+n)   KMP实现代码:

//src为要匹配的字符串,pat为字符串模型
int KMP(char *src,char *pat)
{
    char next[100];
    getNext(pat,next);
    int lengthP = strlen(pat);
    int lengthS = strlen(src);
    int posS=0,posP=-1;
    bool flag = false;
    while(posS < lengthS && posP < lengthP)
    {
        if (posP==-1 ||src[posS] == pat[posP])
        {
            if (flag)
            posS++;
            posP++;
        }else
        {
            posP = next[posP];
            flag = true;
        }
    }
    if (posP<lengthP)return -1;
    else return posS-lengthP;
}

完整的代码:

#include<stdio.h>
#include<string.h>

//获取模式匹配字符串的next数组
void getNext(char *str,char *next)
{
    int j = 0;
    int k = -1;
    int length = strlen(str);
    next[0] = -1;
    while(j<length)
    {
        if(k == -1 || str[j] == str[k])
        {
            j++;
            k++;
            next[j] = k;
        }else k = next[k];
    }
}

//src为要匹配的字符串,pat为字符串模型
int KMP(char *src,char *pat)
{
    char next[100];
    getNext(pat,next);
    int lengthP = strlen(pat);
    int lengthS = strlen(src);
    int posS=0,posP=-1;
    bool flag = false;
    while(posS < lengthS && posP < lengthP)
    {
        if (posP==-1 ||src[posS] == pat[posP])
        {
            if (flag)
            posS++;
            posP++;
        }else
        {
            posP = next[posP];
            flag = true;
        }
    }
    if (posP<lengthP)return -1;
    else return posS-lengthP;
}
int main()
{
    char src[100];
    char pat[50];
    printf("请输入要匹配的字符串和字符串模板(字串):\n");
    scanf("%s%s",src,pat);
    int f = KMP(src,pat);
    printf("在元字符串中匹配位置的下标为 %d ",f);
    return 0;
}

字符串匹配算法KMP算法,布布扣,bubuko.com

时间: 2024-10-11 21:40:07

字符串匹配算法KMP算法的相关文章

字符串匹配算法——KMP算法

1.字符串匹配 字符串匹配是计算机的基本任务之一. 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一.它以三个发明者命名,起头的那个K就是著名科学家Donald Knuth(<计算机程序设计艺术>的作者). 2.KMP算法 这个算法不太容易理解,网上有很多解释,但

字符串匹配算法-kmp算法

一原理: 部分转自:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一.它以三个发

字符串的KMP算法替换

1 #include<iostream> 2 #include<string> 3 using namespace std; 4 5 6 7 class myString 8 { 9 private: 10 string mainstr; 11 int size; 12 void GetNext(string p,int next[]); 13 int KMPFind(string p,int next[]); 14 public: 15 myString(); 16 //~myS

Java数据结构之字符串模式匹配算法---KMP算法

本文主要的思路都是参考http://kb.cnblogs.com/page/176818/ 如有冒犯请告知,多谢. 一.KMP算法 KMP算法可以在O(n+m)的时间数量级上完成串的模式匹配操作,其基本思想是:每当匹配过程中出现字符串比较不等时,不需回溯指针,而是利用已经得到的"部分匹配"结果将模式向右"滑动"尽可能远的一段距离,继续进行比较.显然我们首先需要获取一个"部分匹配"的结果,该结果怎么计算呢? 二.算法分析 在上一篇中讲到了BF算法,

Java数据结构之字符串模式匹配算法---KMP算法2

直接接上篇上代码: 1 //KMP算法 2 public class KMP { 3 4 // 获取next数组的方法,根据给定的字符串求 5 public static int[] getNext(String sub) { 6 7 int j = 1, k = 0; 8 int[] next = new int[sub.length()]; 9 next[0] = -1; // 这个是规定 10 next[1] = 0; // 这个也是规定 11 // 12 while (j < sub.l

[小明学算法]6.字符串匹配算法---KMP

1.简介  字符串匹配就是看看那字符串b是不是字符串a的子串.常用的Knuth-Morris-Pratt 算法,又称KMP算法. 2.主要思想 当patter在某一位置与string匹配失败时,我们除了知道从string的这个位置进行匹配失败这个结果外,是否可以从前面的匹配中获得更多的信息呢.即当前匹配点匹配失败之后,向右滑动的距离是可以提前计算出来的. 3.举例 abcabcabcdef   --------- string abcabcdef         --------- patter

字符串匹配算法KMP详细解释——深入理解

1. 前言 字符串匹配是一个经典算法问题,展开来讲各类问题多达几十种,有名称的算法也不下三十种,所以需要深入学习的东西有很多.这次我们来探讨一个最简单的问题,假设现在随机输入一个长度为m的主串T,另外输入一个长度为n(n≤m)的字符串P,我们来判断字符串P是否是主串T的一个子串(即能否从T中随机取出与P同长的一段字符串,与P完全匹配). 2. 蛮力匹配法 问题很简单,当然也有最直接.最直观也是最好想到的方法,蛮力串匹配.即两个字符串像物流传送带一般,主串固定,子串一步步像前移动,一位位匹配比较,

字符串模式匹配KMP算法中的next数组算法及C++实现

一.问题描述: 对于两个字符串S.T,找到T在S中第一次出现的起始位置,若T未在S中出现,则返回-1. 二.输入描述: 两个字符串S.T. 三.输出描述: 字符串T在S中第一次出现的起始位置,若未出现,则返回-1. 四.输入例子: ababaababcbababc 五.输出例子: 5 六.KMP算法解析: KMP算法分为两步,第一步是计算next数组,第二步是根据next数组通过较节省的方式回溯来比较两个字符串. 网络上不同文章关于next数组的角标含义略有差别,这里取参考文献中王红梅<数据结构

字符串匹配算法-KMP

举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 在上面这个例子中,字符串"BBC ABCDAB ABCDABCDABDE"称为主串,字符串"ABCDABD"称为模式串 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一.下面,我用自己的语言,解释KMP算法. 1.首先,主串"BBC ABCDA