【基本算法】 KMP文本串模式串的字符串匹配算法

看了两个晚上的KMP，加上基本的“暴力匹配”

今晚看懂next[j]递归求解时，突然觉得算法真的好美妙，虽然觉悟的晚但晚胜过没有是吧！

我的博客都是应试性的学习笔记，不具备指导性，还是大神们写的好，例如July和matrix67的博客（今天还知道了matrix67的传奇）

[置顶] 从头到尾彻底理解KMP（2014年8月22日版）

实习辞职了，可以全心全意看书找工作了，自由真是好！！为了我们俩以后在一起！！

什么时候努力都不晚，尽管我的路走的有些曲折，这鸡汤给自己灌得好哇！

今天菜鸟是为了明天的自己不菜鸟，扯多了……

KMP面对的问题：长串（文本串）是S串，短串（模式串）是P串，判断P串是否是S的一个子串，如果是找到P在S中的起始位置

S串索引i

P串索引j

KMP的思想：（假设这里已了解“暴力匹配”算法）

①当p0,p1……pj-1与si-j,si-j+1,……si-1匹配，但pj!=si时，j不必回到0开始匹配

②而是分析P串本身的性质，让“j少回溯一些”，这就和next[j]数组的求值有关

③……（果然看懂和写出来不是一个段位的，图书馆要关门了，先写到这）

附上自己实现代码

#include <iostream>
#include <string>
using namespace std;
//KMP算法，分析短串P中本身的性质，寻找“前缀==后缀的最长串”，从而令索引j少往回走一些
void getNext(char *p, int next[]){
    int k=-1;
    int j=0;
    next[0]=-1;
    int pLen=strlen(p);
    while(j<pLen-1){
        if (k==-1||p[k]==p[j]){
            j++;
            k++;
            next[j]=k;
        }else
            k=next[k];//这里有点晦涩啊，但正是递归的精华所在
    }
}
int KmpSearch(char *s, char *p){
    int i=0,j=0;
    int sLen=strlen(s);
    int pLen=strlen(p);
    int *next=new int[pLen];
    getNext(p,next);
    while (i<sLen && j<pLen){
        if (j==-1 || s[i]==p[j])//这里j=-1还不理解
        {
            i++;
            j++;
        }else
            j=next[j];
    }
    delete next;
    if(j==pLen)
        return i-j;
    else
        return -1;
}

int main()
{
    char *s1="bbc abcdab abcdabcdabde";
    char *s2="abcdabd";
    cout<< KmpSearch(s1, s2) <<endl;
    return 0;
}

时间： 2024-08-27 00:32:13

【基本算法】 KMP文本串模式串的字符串匹配算法的相关文章

KMP算法 KMP模式匹配二（串）

B - KMP模式匹配二(串) Crawling in process... Crawling failed Time Limit:1000MS Memory Limit:131072KB 64bit IO Format:%lld & %llu Description 输入一个主串和一个子串,用KMP进行匹配,问进行几趟匹配才成功,若没成功,则输出0 Input 输入一个主串和一个子串 Output 匹配的趟数 Sample Input ababcabcacbab abcac

KMP算法 KMP模式匹配一（串）

A - KMP模式匹配一(串) Crawling in process... Crawling failed Time Limit:1000MS Memory Limit:131072KB 64bit IO Format:%lld & %llu Description 求子串的next值,用next数组存放,全部输出 Input 输入一个字符串 Output 输出所有next值 Sample Input abaabcac Sample Output 0 1 1 2 2 3 1

【算法】AC自动机/AC算法 - 多模式串快速匹配

AC自动机 Accepted Aho-Corasick 性质 AC自动机/AC算法(Aho-Corasick automaton),是著名的多模式串匹配算法. 前置知识字典树(重要) KMP算法(了解Next数组的作用) 典例与算法复杂度分析典型例题是:给定一个主串 S,给定多个模式串 T,问主串 S 中存在多少个给定的模式串在KMP算法中,一个长度为n的主串一个长度为m的模式串的复杂度为 O(n+m) 而如果直接照搬KMP算法到这种题型下,模式串处理一次就需要匹配一次如果有t个模式串,

POJ 3167 Cow Patterns（模式串浮动匹配）

题目链接:http://poj.org/problem?id=3167 题意:模式串可以浮动的模式匹配问题给出模式串的相对大小,需要找出模式串匹配次数和位置. 思路:统计比当前数小,和于当前数相等的,然后进行kmp. 比如说模式串:1,4,4,2,3,1 而主串:5,6,2,10,10,7,3,2,9,那么2,10,10,7,3,2就是匹配的 code: 1 #include <cstdio> 2 #include <cstring> 3 #include <vector&g

KMP Algorithm 字符串匹配算法KMP小结

这篇小结主要是参考这篇帖子从头到尾彻底理解KMP,不得不佩服原作者,写的真是太详尽了,让博主产生了一种读学术论文的错觉.后来发现原作者是写书的,不由得更加敬佩了.博主不才,尝试着简化一些原帖子的内容,希望能更通俗易懂一些.博主的帖子一贯秉持通俗易懂的风格,使得非CS专业的人士也能读懂,至少博主自己是这么认为的-.-||| KMP算法,全称Knuth-Morris-Pratt算法,根据三个作者Donald Knuth.Vaughan Pratt.James H. Morris的姓氏的首字母拼接而成

KMP字符串匹配算法详解

KMP算法利用匹配失败后的信息,尽量减少模式串与主串的匹配次数以达到快速匹配的目的.具体实现就是实现一个next()函数,函数本身包含了模式串的局部匹配信息.时间复杂度O(m+n). Next()函数的详解把将要进行next计算的字符串S分成 k ,j 前后两串,k代表前串开头所在的序号,j代表后串开头所在的序号,起始的时候j=1,k=0. 我们比较一下前串后串是否相等,要怎么比较呢,肯定是比较S[j]==S[k],如果相等,那么next[j+1]=k+1,然后j++,k++.关键就是理解这

(KMP 1.6)hdu 2203 亲和串(判断文本串循环移位之后是否能将模式串包含在其中)

题目: 亲和串 Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 9139 Accepted Submission(s): 4174 Problem Description 人随着岁数的增长是越大越聪明还是越大越笨,这是一个值得全世界科学家思考的问题,同样的问题Eddy也一直在思考,因为他在很小的时候就知道亲和串如何判断了,但是发现,

(KMP 1.2)hdu 1686 Oulipo(计算模式串在文本串中出现的次数)

题目: Oulipo Time Limit: 3000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 5985 Accepted Submission(s): 2404 Problem Description The French author Georges Perec (1936–1982) once wrote a book, La disparition,

(KMP 1.3)hdu 2087 剪花布条(求文本串中有几个模式串)

题目: 剪花布条 Time Limit: 1000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 10380 Accepted Submission(s): 6684 Problem Description 一块花布条,里面有些图案,另有一块直接可用的小饰条,里面也有一些图案.对于给定的花布条和小饰条,计算一下能从花布条中尽可能剪出几块小饰条来呢? Input 输