KMP学习笔记

功能

字符串T,长度为n。

模板串P,长度为m。在字符串T中找到匹配点i,使得从i开始T[i]=P[0], T[i+1]=P[1], . . . , T[i+m-1]=P[m-1]

KMP算法先用O(m)的复杂度对模板串进行处理,然后O(n)进行匹配。总时间复杂度O(m+n)

注意失配函数f[i]为第i位处不能匹配时应当转向检查第f[i]位是否匹配:

比如模板串:


0


1


2


3


4


5


6


A


B


B


A


A


B


A

得到的失配函数为:


0


1


2


3


4


5


6


7


0


0


0


0


1


1


2


1

也即是说如果在模板串第5位失配,即当前位匹配不成功:


字符串


X


X


A


B


B


A


A


K


X


模板串


A


B


B


A


A


失配

那么根据失配函数f[5]=1,转移到1,表示已经匹配好一位,相当于模板串整体右移,但当前匹配的位置不变,然后继续匹配。


字符串


X


X


A


B


B


A


A


K


X


模板串


A


失配函数另一种用途:如果P存在循环节,f[i]为前一个循环节对应字符的位置。比如ABCABC,那么P[4]=B,而f[5]=2,也就是P[1]=B。

用途:计算字符串循环节长度。

构造失配函数:

s为模板串,f为待构造的失配数组,开始时为空

void getFail(char *s,int *f)
{
    int m=strlen(s),j;
    f[0]=0;f[1]=0;
    for (int i=1;i<m;i++)
    {
        j=f[i];
        while (j&&s[i]!=s[j]) j=f[j];
        f[i+1]=(s[i]==s[j]?j+1:0);
    }
}

匹配函数:

输入

t:文本,一大串字符串

s:模板,待匹配的模板

f:失配数组,一开始为空,函数过程中调用失配数组构造函数

输出

t字符串中模板第一次出现的位置(从0开始)

int find(char *t,char *s,int *f)
{
    int n=strlen(t),m=strlen(s);
    getFail(s,f);
    int j=0;
    for (int i=0;i<n;i++)
    {
        while (j&&s[j]!=t[i]) j=f[j];
        if (s[j]==t[i]) j++;
        if (j==m) return i-m+1;
    }
}
时间: 2024-12-28 22:03:22

KMP学习笔记的相关文章

算法学习笔记 KMP算法之 next 数组详解

最近回顾了下字符串匹配 KMP 算法,相对于朴素匹配算法,KMP算法核心改进就在于:待匹配串指针 i 不发生回溯,模式串指针 j 跳转到 next[j],即变为了 j = next[j]. 由此时间复杂度由朴素匹配的 O(m*n) 降到了 O(m+n), 其中模式串长度 m, 待匹配文本串长 n. 其中,比较难理解的地方就是 next 数组的求法.next 数组的含义:代表当前字符之前的字符串中,有多大长度的相同前缀后缀,也可看作有限状态自动机的状态,而且从自动机的角度反而更容易推导一些. "前

KMP算法 学习笔记

kmp算法在很多人看来是如此的厉害,很早之前就学过了,但是各种看不懂把我拦住了,现在重新拾取,来写一下个人的学习总结. kmp看毛片算法(小甲鱼教的)(在这给小甲鱼做个广告,我个人看来小甲鱼讲的数据结构很好,很有趣.个人创业不容易,希望大家多多支持www.fishc.com小甲鱼,我跟小甲鱼素不相识,只是有用的东西大家分享) 好了言归正传. 如果你之前看过kmp算法没有看懂希望在这不要带着一种恐惧感,如果你没看过那是更好. 网上有很多详细教程,但是大部分都很啰嗦,容易把人看晕. kmp算法没有什

字符串学习笔记

字符串学习笔记 注:本文涉及到的所有变量名均与模板中变量名同步.模板链接 一.Hash 1.双Hash 2.链式Hash 3.树Hash 二.KMP 1.概述 查询字符串 \(t\) 在字符串 \(s\) 中出现过的所有位置.时间复杂度 \(O(len(s)+len(t))\). char *s = "abacaba"; char *t = "aba"; 0 1 2 3 4 5 6 a b a c a b a \(t\) 在 \(s\) 中出现过的位置为0.4. 2

vector 学习笔记

vector 使用练习: /**************************************** * File Name: vector.cpp * Author: sky0917 * Created Time: 2014年04月27日 11:07:33 ****************************************/ #include <iostream> #include <vector> using namespace std; int main

Caliburn.Micro学习笔记(一)----引导类和命名匹配规则

Caliburn.Micro学习笔记(一)----引导类和命名匹配规则 用了几天时间看了一下开源框架Caliburn.Micro 这是他源码的地址http://caliburnmicro.codeplex.com/ 文档也写的很详细,自己在看它的文档和代码时写了一些demo和笔记,还有它实现的原理记录一下 学习Caliburn.Micro要有MEF和MVVM的基础 先说一下他的命名规则和引导类 以后我会把Caliburn.Micro的 Actions IResult,IHandle ICondu

jQuery学习笔记(一):入门

jQuery学习笔记(一):入门 一.JQuery是什么 JQuery是什么?始终是萦绕在我心中的一个问题: 借鉴网上同学们的总结,可以从以下几个方面观察. 不使用JQuery时获取DOM文本的操作如下: 1 document.getElementById('info').value = 'Hello World!'; 使用JQuery时获取DOM文本操作如下: 1 $('#info').val('Hello World!'); 嗯,可以看出,使用JQuery的优势之一是可以使代码更加简练,使开

[原创]java WEB学习笔记93:Hibernate学习之路---Hibernate 缓存介绍,缓存级别,使用二级缓存的情况,二级缓存的架构集合缓存,二级缓存的并发策略,实现步骤,集合缓存,查询缓存,时间戳缓存

本博客的目的:①总结自己的学习过程,相当于学习笔记 ②将自己的经验分享给大家,相互学习,互相交流,不可商用 内容难免出现问题,欢迎指正,交流,探讨,可以留言,也可以通过以下方式联系. 本人互联网技术爱好者,互联网技术发烧友 微博:伊直都在0221 QQ:951226918 -----------------------------------------------------------------------------------------------------------------

Activiti 学习笔记记录(三)

上一篇:Activiti 学习笔记记录(二) 导读:上一篇学习了bpmn 画图的常用图形标记.那如何用它们组成一个可用文件呢? 我们知道 bpmn 其实是一个xml 文件

HTML&CSS基础学习笔记8-预格式文本

<pre>标签的主要作用是预格式化文本.被包围在 pre 标签中的文本通常会保留空格和换行符.而文本也会呈现为等宽字体. <pre>标签的一个常见应用就是用来表示计算机的源代码.当然你也可以在你需要在网页中预显示格式时使用它. 会使你的文本换行的标签(例如<h>.<p>)绝不能包含在 <pre> 所定义的块里.尽管有些浏览器会把段落结束标签解释为简单地换行,但是这种行为在所有浏览器上并不都是一样的. 更多学习内容,就在码芽网http://www.