字符串匹配:KMP

參考:从头到尾彻底理解KMP

在字符串 str 中 匹配模式串 pattern

1. 计算模式串的 next 数组;

2. 在字符串中匹配模式串;当一个字符匹配时,str[i++], pattern[k++] 继续匹配下一个字符;当当前字符不匹配时。依据 next 数组移动模式字符串。k = next[k]

next 数组:描写叙述模式串中最长同样的前缀和后缀的长度。

#include <iostream>
using namespace std;

class Solution {
public:
    void GetNext(string pattern) {
        next = new int[pattern.size()];
        next[0] = -1;
        int k = -1;
        int j = 0;
        while (j < pattern.size()-1) {
            if (k == -1 || pattern[j] == pattern[k]) {
                ++j;
                ++k;
                if (pattern[j] != pattern[k]) {
                    // 此时的 pattern[k] 即为 pattern[next[j] ]
                    next[j] =k;
                } else {
                    // 假设 pattern[j] == pattern[next[j]]。则 k = next[k]
                    next[j] = next[k];
                }
            } else {
                k = next[k]; // 不匹配。向前找前缀。相当于用模式串匹配模式串
            }
        }
    }

    int KMPSearch(string str, string pattern) {
        if (str.size() == 0 || pattern.size() == 0)
            return -1;
        GetNext(pattern);
        int j = 0; // 待匹配串索引
        int k = 0; // 模式串索引
        while (j < str.size() && k < (int)pattern.size()) {  //注意,负数不能和 size_t 的无符号数作比較
            if (k == -1 || str[j] == pattern[k]) {
                ++k;
                ++j;
            } else {
                k = next[k]; // 不匹配,移动模式串
            }
        }
        if (k == pattern.size())
            return j-k;
        else
            return -1;
    }
    Solution() {
        next = NULL;
    }
    ~Solution() {
        if (next != NULL)
            delete []next;
        next = NULL;
    }
private:
    int *next;
};

int main()
{
    string str = "abacababc";
    string pattern = "abab";
    Solution sol;
    cout << sol.KMPSearch(str, pattern) << endl;
}

相关:

Implement strStr() | 实现字符串查找函数: 用 hash-code 的方法实现字符串的搜索;easy实现,须要支持大数。

字符串匹配的Boyer-Moore算法:思路简单,性能更好,但不easy计算得到好后缀表和坏字符表

时间: 2024-08-29 19:34:23

字符串匹配:KMP的相关文章

字符串匹配KMP next数组的理解

#include<cstdio> #include<cstring> void getNext(int *Next,char* src){ int i,j; Next[0]=-1; i=0; j=-1; int N=strlen(src); while(i<N-1){ if(j==-1||src[i]==src[j]){ ++i; ++j; Next[i]=j; }else{ /* 理解难点:假设已经存在Next:假设是两个字符串在进行比较. 1. a)现在有两个字符串 sr

【Foreign】字符串匹配 [KMP]

字符串匹配 Time Limit: 10 Sec  Memory Limit: 256 MB Description Input Output Sample Input 3 3 6 3 1 2 1 2 3 2 3 1 3 6 3 1 2 1 2 1 2 3 1 3 6 3 1 1 2 1 2 1 3 1 3 Sample Output 3 1 2 4 4 1 2 3 4 3 2 3 4 HINT Source 发现题目中颜色的具体权值是对答案无关的,然后就是只要相对位置一样即可. 那么显然是一个

字符串匹配KMP算法C++代码实现

看到了一篇关于<字符串匹配的KMP算法>(见下文)的介绍,地址:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html,这篇博客对KMP算法的解释很清晰,但缺点是没有代码的实现.所以本人根据这位大神的思路写了一下算法的C++实现. C++代码如下: #include <iostream> #include<string.h> using namesp

字符串匹配--kmp算法原理整理

kmp算法原理:求出P0···Pi的最大相同前后缀长度k: 字符串匹配是计算机的基本任务之一.举例,字符串"BBC ABCDAB ABCDABCDABDE",里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一. KMP算法搜索如下: 1.首先,字符串"BBC ABCDAB ABCDABCDABDE"的第一个字符与搜索词"ABCDABD"的

zstu.4194: 字符串匹配(kmp)

4194: 字符串匹配 Time Limit: 1 Sec  Memory Limit: 128 MB Submit: 206  Solved: 78 Description 给你两个字符串A,B,请输出B字符串在A字符串中出现了几次. Input 多组测试数据,每组输入两个字符串.字符串的长度 <= 1000000. Output 输出B在A中出现的次数. Sample Input aaa aa Sample Output 1 HINT Source WuYiqi 1 #include <c

字符串匹配 - KMP算法

首先大致的学习一下有限自动机字符匹配算法,然后在讨论KMP算法. 有限自动机 一个有限自动机M是一个五元组(Q,q0,A,Σ,δ),其中: Q是状态的集合, q0∈Q是初始状态, A是Q的字集,是一个接受状态集合, Σ是一个有限的输入字母表, δ是一个从Q×Σ到Q的函数,叫做转移函数. 下面定义几个相关函数: φ(w)是M在扫描字符串w后终止时的状态.函数φ有下列递归关系定义:φ(ε) = q0,φ(wa) = δ(φ(w),a), σ(x)是x的后缀中,关于P的最长前缀的长度. 字符串匹配自动

字符串匹配KMP算法

1. 字符串匹配的KMP算法 2. KMP算法详解 3. 从头到尾彻底理解KMP

字符串匹配-KMP算法学习笔记

参考文章: 1.字符串匹配的KMP算法 2.KMP算法详解 3.从头到尾彻底理解KMP 版权声明:本文为博主原创文章,未经博主允许不得转载.

字符串匹配KMP算法的理解(详细)

1. 引言 本KMP原文最初写于2年多前的2011年12月,因当时初次接触KMP,思路混乱导致写也写得混乱.所以一直想找机会重新写下KMP,但苦于一直以来对KMP的理解始终不够,故才迟迟没有修改本文. 然近期因开了个算法班,班上专门讲解数据结构.面试.算法,才再次仔细回顾了这个KMP,在综合了一些网友的理解.以及算法班的两位讲师朋友曹博.邹博的理解之后,写了9张PPT,发在微博上.随后,一不做二不休,索性将PPT上的内容整理到了本文之中(后来文章越写越完整,所含内容早已不再是九张PPT 那样简单

数据结构与算法简记--字符串匹配KMP算法

KMP算法 比较难理解,准备有时间专门啃一下. 核心思想与BM算法一样:假设主串是 a,模式串是 b.在模式串与主串匹配的过程中,当遇到不可匹配的字符的时候,我们希望找到一些规律,可以将模式串往后多滑动几位,跳过那些肯定不会匹配的情况. 不同的是:在模式串和主串匹配的过程中,把不能匹配的那个字符仍然叫作坏字符,把已经匹配的那段字符串叫作好前缀. 关键找相等的最长匹配前缀和最长匹配后缀.有两种情况,(1)如果b[i-1]的最长前缀下一个字符与b[i]相等,则next[i]=next[i-1]+1.