查找字符串的 KMP 算法

查找字符串是我们平常编程过程中经常遇到的,现在介绍一种查找字符串算法,增加程序的执行速度。

通常我们是这么写的:

/*
  content: search a string in a othor string
  author:  lw
  date:    2015-01-30
  target: kmp algorithm
                      */

#include <stdio.h>
#include <string.h>

void compare(char * sourcestr, char * targetstr)
{
    char *moveSource, *moveTarget, *headPoint;
    int num = 0;
    headPoint = sourcestr;
    moveSource = sourcestr;
    moveTarget = targetstr;
    while(*headPoint != *moveTarget)
            headPoint++;
    moveSource = headPoint;
    while(*moveSource != ‘\0‘ && *moveTarget != ‘\0‘)
    {
        num++;
        moveSource++;
        moveTarget++;
        if(num == 3)
            break;
        while(*moveSource != *moveTarget)//-->kmp
        {
            headPoint = headPoint + 1;
            moveSource = headPoint;
            num = 0;
            moveTarget = targetstr;
        }
    }
    printf("%s\n", headPoint);
}

int main()
{
    char *source = "mabveacabiabcy";
    char *target = "abc";
    char *sourcestr;
    char *targetstr;
    sourcestr = (char *)malloc(15 * sizeof(char));
    targetstr = (char *)malloc(4 * sizeof(char));
    memset(sourcestr, ‘\0‘, 15 * sizeof(char));
    memset(targetstr, ‘\0‘, 4 * sizeof(char));
    strncpy(sourcestr, source, 15);
    strncpy(targetstr, target, 4);
    compare(sourcestr, targetstr);
    return 0;
}

现在把函数  compare()  函数中的内 while() 中的内容改进一下:

            

说明:拿字符串 mabveacabiabcy 来说,当查找到字符 v 时发现和 abc 中的 c 不同,则指向字符串 mabveacabiabcy 中的第二个字符的指针就要移动,如果不使用 kmp 算法,那么指针移动一位,如果使用 kmp 算法,则指针移动两位,因为当比较到字符 v 时我们实际已经知道 v 以前的字符是什么了,所以可以断定不止要移动一位,具体移动几位就和字符串 abc 有关了,要判断其是否回文字符串,此例中 abc 对应数组 1,2,0 。

修改后的代码如下:

/*
  content: search a string in a othor string
  author:  lw
  date:    2015-01-30
  target: kmp algorithm
                      */

#include <stdio.h>
#include <string.h>

void compare(char * sourcestr, char * targetstr)
{
    char *moveSource, *moveTarget, *headPoint;
    int num = 0;
    headPoint = sourcestr;
    moveSource = sourcestr;
    moveTarget = targetstr;
    while(*headPoint != *moveTarget)
            headPoint++;
    moveSource = headPoint;
    while(*moveSource != ‘\0‘ && *moveTarget != ‘\0‘)
    {
        num++;
        moveSource++;
        moveTarget++;
        if(num == 3)
            break;
        while(*moveSource != *moveTarget)//-->kmp
        {
            if(num > 0)
                headPoint = headPoint + num;
            else
                headPoint = headPoint + 1;
            moveSource = headPoint;
            num = 0;
            moveTarget = targetstr;
        }
    }
    printf("%s\n", headPoint);
}

int main()
{
    char *source = "mabveacabiabcy";
    char *target = "abc";
    char *sourcestr;
    char *targetstr;
    sourcestr = (char *)malloc(15 * sizeof(char));
    targetstr = (char *)malloc(4 * sizeof(char));
    memset(sourcestr, ‘\0‘, 15 * sizeof(char));
    memset(targetstr, ‘\0‘, 4 * sizeof(char));
    strncpy(sourcestr, source, 15);
    strncpy(targetstr, target, 4);
    compare(sourcestr, targetstr);
    return 0;
}

时间: 2024-10-09 02:46:14

查找字符串的 KMP 算法的相关文章

字符串的KMP算法替换

1 #include<iostream> 2 #include<string> 3 using namespace std; 4 5 6 7 class myString 8 { 9 private: 10 string mainstr; 11 int size; 12 void GetNext(string p,int next[]); 13 int KMPFind(string p,int next[]); 14 public: 15 myString(); 16 //~myS

字符串匹配算法KMP算法

数据结构中讲到关于字符串匹配算法时,提到朴素匹配算法,和KMP匹配算法. 朴素匹配算法就是简单的一个一个匹配字符,如果遇到不匹配字符那么就在源字符串中迭代下一个位置一个一个的匹配,这样计算起来会有很多多余的不符合的匹配做了冗余的比较.假设源字符串长n,字串长m 该算法最差时间复杂度为 m*(n-m+1),记为O(n*m);这里不做过多解释朴素匹配算法. KMP算法: kmp算法不是在源字符串中下手,他是从字串下手,比如我要在源字符串(acabaabaabcacaabc)中匹配一个字符串字串(ab

子字符串查找之————关于KMP算法你不知道的事

写在前面: (阅读本文前需要了解KMP算法的基本思路.另外,本着大道至简的思想,本文的所有例子都会做从头到尾的讲解) 作者翻阅了大量网上现有的KMP算法博客,发现广为流传的竟然是一种不完整的KMP算法.即通过next数组来作为有限状态自动机,以此实现非匹配时的回退.这不失为一种好的方法. 但我们接下来要见识的是一种更好和更完整的方法————拥有完整DFA的KMP算法 先列出本文要介绍的方法与一般方法对比下的几大优点: 在最坏情况下,对字符串的操作次数仅为一般做法的三分之二. 在所有情况下,对字符

字符串模式匹配KMP算法中的next数组算法及C++实现

一.问题描述: 对于两个字符串S.T,找到T在S中第一次出现的起始位置,若T未在S中出现,则返回-1. 二.输入描述: 两个字符串S.T. 三.输出描述: 字符串T在S中第一次出现的起始位置,若未出现,则返回-1. 四.输入例子: ababaababcbababc 五.输出例子: 5 六.KMP算法解析: KMP算法分为两步,第一步是计算next数组,第二步是根据next数组通过较节省的方式回溯来比较两个字符串. 网络上不同文章关于next数组的角标含义略有差别,这里取参考文献中王红梅<数据结构

字符串匹配算法——KMP算法

1.字符串匹配 字符串匹配是计算机的基本任务之一. 字符串匹配是什么?举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一.它以三个发明者命名,起头的那个K就是著名科学家Donald Knuth(<计算机程序设计艺术>的作者). 2.KMP算法 这个算法不太容易理解,网上有很多解释,但

字符串匹配算法-kmp算法

一原理: 部分转自:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 字符串匹配是计算机的基本任务之一. 举例来说,有一个字符串"BBC ABCDAB ABCDABCDABDE",我想知道,里面是否包含另一个字符串"ABCDABD"? 许多算法可以完成这个任务,Knuth-Morris-Pratt算法(简称KMP)是最常用的之一.它以三个发

匹配字符串的KMP算法

其中next序列,表示子串的前后缀最大匹配长度. 例如对于字符串C[], next[i]表示子串c[0 .. i]中, 前缀与后缀的最大匹配长度. 举例如果子串是 abcuab, 其前缀是a, ab, abc, abcu, abcua, 后缀是 b, ab, uab, cuab, bcuab, 其中匹配的最大子串是ab, 长度是2. 按定义挨个计算next的值 public static int[] getNexts(char[] tt) { int[] nexts = new int[tt.l

HDU-1358 Period 字符串问题 KMP算法 求最小循环节

题目链接:https://cn.vjudge.net/problem/HDU-1358 题意 给一个字符串,对下标大于2的元素,问有几个最小循环节 思路 对每个元素求一下minloop,模一下就好 提交过程 TLE maxn没给够 AC 代码 #include <cstring> #include <cstdio> const int maxm=1e6+20; char P[maxm]; int fail[maxm]; void getFail(int m){ fail[0]=fa

萌新笔记——用KMP算法与词典实现屏蔽敏感词(UTF-8编码)

前几天写好了字典,又刚好重温了KMP算法,恰逢遇到朋友吐槽最近被和谐的词越来越多了,于是突发奇想,想要自己实现一下敏感词屏蔽. 基本敏感词的屏蔽说起来很简单,只要把字符串中的敏感词替换成"***"就可以了.对于子串的查找,就KMP算法就可以了.但是敏感词这么多,总不能一个一个地遍历看看里面有没有相应的词吧! 于是我想到了前几天写的字典树.如果把它改造一下,并KMP算法结合,似乎可以节约不少时间. 首先说明一下思路: 对于KMP算法,这里不过多阐述.对于敏感词库,如果把它存进字典树,并在