kmp算法 汇总

来源:http://blog.csdn.net/qq_34494458/article/details/75253466

KMP算法,是由Knuth,Morris,Pratt共同提出的模式匹配算法,其对于任何模式和目标序列,都可以在线性时间内完成匹配查找,而不会发生退化,是一个非常优秀的模式匹配算法。

/*
 * next[]的含义(前提):x[i-next[i]...i-1] = x[0...next[i]-1]这很重要;
 * next[i]为满足x[i-z...i-1] = x[0...z-1]的最大值z(就是x的自身匹配);
 */

 //求next的代码实现
 /*
 * next[]求到了next[m],这个next[m]作用还很大;
 */
void kmp_pre(char x[], int m, int next[]) {
    int i, j;
    j = next[0] = -1;
    i = 0;
    while (i < m) {
        while (-1 != j && x[i] != x[j]) j = next[j];
        //j = -1,表示第0位都没匹配成功;那就要直接推进一位;
        next[++i] = ++j;
    }
}

/*
 *还可以有一个小优化;
 */
void preKMP(char x[], int m, int kmpNext[]) {
    int i, j;
    j = kmpNext[0] = -1;
    i = 0;
    while (i < m) {
        while (-1 != j && x[i] != x[j]) j = kmpNext[j];
        if (x[++i] == x[++j]) kmpNext[i] = kmpNext[j];
        else kmpNext[i] = j;
        /*这个if很6,这除去了一些无意义的next[],大概意思是
        *如果x[j]匹配失败了,那么就执行 j = next[j];
        *而x[j] = x[next[j]]所以x[next[j]]肯定也会匹配失败。
        *所以就说这个next[j]是无意义的。
        */
    }
}

/*
 *x与y匹配;
 *返回x在y中出现的次数,可以重叠
 *与求next[]函数的写法基本相似;
 */

 int next[10010];
 int KMP_Count(char x[], int m, char y[], int n) {
     //x是模式串,y是主串;
     int i, j;
     int ans = 0;
     //preKMP(x, m, next);
     kmp_pre(x, m, next);
     i = j = 0;
     while (i < n) {
        while (-1 != j && y[i] != x[j]) j = next[j];
        i++; j++;
        if (j >= m) {
            ans++;
            j = next[j];
        }
     }
     return ans;
 }

经典题目:

看他的博客吧:http://blog.csdn.net/guhaiteng/article/details/52108690

加一个题目:http://poj.org/problem?id=3167

/*
 *模式串可以浮动的模式串匹配问题
 *给出模式串的相对大小,需要找出模式串匹配次数和位置
 *比如说模式串: 1,4,4,2,3,1 而主串:5,6,2,10,10,7,3,2,9
 *那么子串:2,10,10,7,3,2就是和模式串匹配的。
 *思路:只需比较前面比当前数小的数与等于当前数的数的个数就好了,看这两个东西是否相等来进行kmp。
 */
 //#include<bits/stdc++.h>
#include <iostream>
#include <string>
#include <queue>
#include <map>
#include <cstring>
#include <cstdio>
#include <vector>
using namespace std;
typedef long long LL;
#define lson k<<1, ll, mid
#define rson k<<1|1, mid+1, rr
const int MAXN = 100008;
int n, k, s, next[MAXN>>2], as[MAXN][26], bs[MAXN>>2][26], a[MAXN], b[MAXN];
vector<int> ans;

void init() {//把输入的字符串同化成as和bs;
    scanf("%d%d%d", &n, &k, &s);
    for(int i = 0; i < n; i++) {
        scanf("%d", &a[i]);
        if (i != 0) {
            for(int j = 1; j < 26; j++)
                as[i][j] = as[i-1][j];
        }
        as[i][a[i]]++;
    }
    for(int i = 0; i < k; i++) {
        scanf("%d", &b[i]);
        if (i != 0) {
            for(int j = 1; j < 26; j++)
                bs[i][j] = bs[i-1][j];
        }
        bs[i][b[i]]++;
    }
}

//这里是没有嵌套while循环的写法,都是一样的。
void build_next() {
    next[0] = -1;
    next[1] = 0;//这里皮了一下
    int j = 0, i = 1;
    while (i < k) {
        int t11 = 0, t12, t21 = 0, t22;
        for(int t = 1; t < b[i]; t++)
            if (i == j) t11 += bs[i][t];
            else t11 += (bs[i][t]-bs[i-j-1][t]);
        if (i == j) t12 = bs[i][b[i]];
        else t12 = bs[i][b[i]]-bs[i-j-1][b[i]];
        for(int t = 1; t < b[j]; t++)
            t21 += bs[j][t];
        t22 = bs[j][b[j]];
        if (t11 == t21 && t12 == t22)
            next[++i] = ++j;
        else j = next[j];
    }
}

void kmp() {
    ans.clear();
    build_next();
    int i = 0, j = 0;
    while (i < n) {
        int t11 = 0, t12, t21 = 0, t22;
        for(int t = 1; t < a[i]; t++)
            if (i == j) t11 += as[i][t];
            else t11 += (as[i][t]-as[i-j-1][t]);
        if (i == j) t12 = as[i][a[i]];
        else t12 = as[i][a[i]]-as[i-j-1][a[i]];
        for(int t = 1; t < b[j]; t++)
            t21 += bs[j][t];
        t22 = bs[j][b[j]];
        if (t11 == t21 && t12 == t22) {
            ++i; ++j;
            if (j >= k) {
                ans.push_back(i-j+1);
                j = next[j];
            }
        }
        else j = next[j];
    }
}

int main() {
    //freopen("in.txt", "r", stdin);
    init();
    kmp();
    printf("%d\n", s = ans.size());
    for(int i = 0; i < s; i++)
        printf("%d\n", ans[i]);
    return 0;
}
时间: 2024-09-30 18:36:13

kmp算法 汇总的相关文章

跳跃表,字典树(单词查找树,Trie树),后缀树,KMP算法,AC 自动机相关算法原理详细汇总

第一部分:跳跃表 本文将总结一种数据结构:跳跃表.前半部分跳跃表性质和操作的介绍直接摘自<让算法的效率跳起来--浅谈"跳跃表"的相关操作及其应用>上海市华东师范大学第二附属中学 魏冉.之后将附上跳跃表的源代码,以及本人对其的了解.难免有错误之处,希望指正,共同进步.谢谢. 跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找.插入.删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领.而且最重要的一点,就是它的编程复杂度较同类

hiho 1015 KMP算法 &amp;&amp; CF 625 B. War of the Corporations

#1015 : KMP算法 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 小Hi和小Ho是一对好朋友,出生在信息化社会的他们对编程产生了莫大的兴趣,他们约定好互相帮助,在编程的学习道路上一同前进. 这一天,他们遇到了一只河蟹,于是河蟹就向小Hi和小Ho提出了那个经典的问题:“小Hi和小Ho,你们能不能够判断一段文字(原串)里面是不是存在那么一些……特殊……的文字(模式串)?” 小Hi和小Ho仔细思考了一下,觉得只能想到很简单的做法,但是又觉得既然河蟹先生这么说了,就

KMP算法详解

这几天学习kmp算法,解决字符串的匹配问题,开始的时候都是用到BF算法,(BF(Brute Force)算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串T的第一个字符进行匹配,若相等,则继续比较S的第二个字符和 T的第二个字符;若不相等,则比较S的第二个字符和T的第一个字符,依次比较下去,直到得出最后的匹配结果.BF算法是一种蛮力算法.)虽然也能解决一些问题,但是这是常规思路,在内存大,数据量小,时间长的情况下,还能解决一些问题,但是如果遇到一些限制时间和内存的字符串问

KMP算法

1 /* next数组是KMP算法的关键,next数组的作用是:当模式串T和主串S失配 2 * ,next数组对应的元素指导应该用T串中的哪一个元素进行下一轮的匹配 3 * next数组和T串相关,和S串无关.KMP的关键是next数组的求法. 4 * 5 * ——————————————————————————————————————————————————————————————————— 6 * | T | 9 | a | b | a | b | a | a | a | b | a | 7

KMP算法解决字符串出现次数

比如主串为:"1001110110" 子串为:"11" 则出现位置分别为:3 4 7 //KMP算法 2015.6.7 #include<iostream> #include<stdlib.h> using namespace std; int main() { char *s = "1001110110"; char *p = "11"; int ar[20] = { 0 }; //next ar[0

串模式匹配之BF和KMP算法

本文简要谈一下串的模式匹配.主要阐述BF算法和KMP算法.力求讲的清楚又简洁. 一 BF算法 核心思想是:对于主串s和模式串t,长度令为len1,len2,   依次遍历主串s,即第一次从位置0开始len2个字符是否与t对应的字符相等,如果完全相等,匹配成功:否则,从下个位置1开始,再次比较从1开始len2个字符是否与t对应的字符相等.... BF算法思路清晰简单,但是每次匹配不成功时都要回溯. 下面直接贴代码: int BF_Match(char *s, char *t) { int i=0,

字符串的KMP算法替换

1 #include<iostream> 2 #include<string> 3 using namespace std; 4 5 6 7 class myString 8 { 9 private: 10 string mainstr; 11 int size; 12 void GetNext(string p,int next[]); 13 int KMPFind(string p,int next[]); 14 public: 15 myString(); 16 //~myS

算法 - KMP算法

1 解决问题 从一个字符串中查找子串,如果存在返回字串在字符串中的位置. 示例: 字符串(T):"BBC ABCDAB ABCDABCDABDE" 子串( P):"ABCDABD" 通过算法查找字串P在字符串T中的位置为15(从0开始). 2 暴力算法 思路: 循环T,从T的每个字符开始子字串P匹配. 代码: int strstr(char iTarget[], int iTLen, char iPattern[], int iPLen) { for (int i

字符串模式匹配KMP算法中的next数组算法及C++实现

一.问题描述: 对于两个字符串S.T,找到T在S中第一次出现的起始位置,若T未在S中出现,则返回-1. 二.输入描述: 两个字符串S.T. 三.输出描述: 字符串T在S中第一次出现的起始位置,若未出现,则返回-1. 四.输入例子: ababaababcbababc 五.输出例子: 5 六.KMP算法解析: KMP算法分为两步,第一步是计算next数组,第二步是根据next数组通过较节省的方式回溯来比较两个字符串. 网络上不同文章关于next数组的角标含义略有差别,这里取参考文献中王红梅<数据结构