看数据结构写代码（18） KMP算法

求子串的位置有两种方法，一种是暴力搜索法，另一种就是KMP 算法。他们的效率在一般的情况下，区别不大。但是在串的变化范围特别小的情况下，例如只有 0 和 1，KMP 的时间复杂度是 O(m+n)，而暴力搜索法定时间复杂度是 O(m*n),(m,n分别指子串和母串的长度）

下面给出两种算法的代码

欢迎指出代码不足

// Kmp2.cpp : 定义控制台应用程序的入口点。
//

#include "stdafx.h"
#include <stdlib.h>
#include <string.h>

//暴力模式匹配（求子串位置）
int stringIndex(char * string,char * sub,int pos){
	char * p = string;
	int lenString = strlen(string);
	int lenSub = strlen(sub);
	int matchTimes = 0;
	for (int i = pos -1; i <= lenString - lenSub; i++)
	{
		int temp = i;
		for (int j = 0; j < lenSub;)
		{
			matchTimes++;
			if (string[temp] == sub[j])
			{
				temp++,j++;
				if (j == lenSub)
				{
					printf("暴力匹配算法，执行次数： %d\n",matchTimes);
					return i+1;
				}
			}
			else
			{
				break;
			}
		}
	}
	printf("暴力匹配算法，执行次数： %d\n",matchTimes);
	return 0;
}

//KMP 模式匹配法..
void getNext(char * sub,int * nextArray);
static int kmpTimes = 0;
int kmpIndex(char * string,char * sub,int pos){
	int stringLen = strlen(string);
	int subLen = strlen(sub);
	int i=pos-1,j=0;
	kmpTimes = 0;
	int * nextArray = (int *)malloc(sizeof(int) * subLen);
	getNext(sub,nextArray);
	while (i < stringLen - subLen + 1 && j < subLen)
	{
		kmpTimes++;
		if (j == -1 || string[i] == sub[j]  )
		{
			i++,j++;
		}
		else
		{
			j = nextArray[j];
		}
	}
	free(nextArray);
	printf("KMP匹配算法，执行次数(包括getNext函数匹配次数)： %d\n",kmpTimes);
	return j == subLen ?  i-subLen+1: 0;
}

void getNext(char * sub,int * nextArray){
	int subLen = strlen(sub);
	nextArray[0] = -1;
	for (int i = 0,j = -1; i < subLen -1;)
	{
		kmpTimes++;
		if (j == -1 || sub[i] == sub[j])
		{
			i ++ ,j ++;
			if (sub[i] != sub[j])
			{
				nextArray[i] = j;
			}
			else
			{
				nextArray[i] = nextArray[j];
			}
		}
		else
		{
			j = nextArray[j];
		}
	}
}

//打印 信息
void printMsg(char * string,int index,int kmp){
	char * point = string + index - 1;
	char * kmpPoint = string + kmp - 1;
	printf("暴力模式匹配 字符串为：%s\n,KMP模式匹配算法字符串为:%s\n",point,kmpPoint,kmp);
}

int _tmain(int argc, _TCHAR* argv[])
{
	char * string = "abcdefghijklmnsdfdsdfsfdsd";
	char * sub = "sdfd";
	int index = stringIndex(string,sub,1);
	int kmp = kmpIndex(string,sub,1);
	printMsg(string,index,kmp);
	string = "00000000000000000000000000000000000111111111111111111100";
	sub = "000000000001111";
	index = stringIndex(string,sub,1);
	kmp = kmpIndex(string,sub,1);
	printMsg(string,index,kmp);
	return 0;
}

时间： 2024-08-26 18:58:51

看数据结构写代码（18） KMP算法的相关文章

看数据结构写代码（32) 赫夫曼树编码以及译码

杂谈:最近有点慵懒,不好不好.好几天都没写代码,原本准备上星期完结树这一章节的.现在又耽误了.哎.要抓紧时间啊. 下面直接上代码: 可以到我的网盘下载源代码,或者直接拷贝下面的源代码运行网盘地址:点击打开链接 // HuffmanTree.cpp : 定义控制台应用程序的入口点. //哈弗曼编码,译码 #include "stdafx.h" #include <stdlib.h> #include <cstring> enum E_State { E

看数据结构写代码（47）迪杰斯特拉最短路径算法

这个算法的思想根求最小生成树算法普里姆(Prim)算法极其相似.迪杰斯算法是求一个顶点到其他顶点的最短路径算法. 下面上代码:(用的是邻接矩阵表示法) //迪杰斯特拉最短路径. //从 vex顶点到其他顶点的最短路径 void shortestPath_Dij(MGraph g,char vex){ int loc = graphLocation(g,vex); int minArray[MAX_VERTEX_NUM]={0};//最小路径值 bool fin

看数据结构写代码（67）置换 _ 选择排序（完结篇）

杂谈: 严蔚敏版<数据结构(C语言版)> 一书终于看完了.这是一个完结,也是一个新的开端.<算法导论> 已到手. 置换选择排序的思想是将归并段尽量变的更大,而不是根据内存大小限制在固定的大小. 这样可以利用赫夫曼树来进行最优归并树,从而使外存读写次数最少. 下面给出具体代码:欢迎指出代码不足. // Replace_Selcetion.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h&q

看数据结构写代码（44）判断无向图是否有环路

在看严蔚敏的数据结构一书 7.5小节时,书上说" 判断有向图是否存在环要不无向图复杂.对于无向图来说,深度优先遍历过程中遇到回边(即指向已访问过的顶点的边),则必定存在环路". 看的不明白,所以网上百度了一下. 有了思路:故写下算法和思路,以便以后温故. 思路: 1.一个n个顶点,e条边的无向图,若 e>= n,必有环路. 2.若 e < n ,需要深度遍历,并把父节点传入参数中,如果遇到一个节点被访问过并且不是父节点,那么就有环

看数据结构写代码（50）伙伴系统

伙伴系统是一种只可以分配 2的幂次方个空间的 ,回收内存时只合并 "伙伴空间" 的一种动态内存管理方式. 例如一个空间大小为 64 的内存,伙伴系统为这 64 的内存建立一组双向循环链表,分别管理着 2的 0 次方,2的1 次方幂,2的 2 次方幂...2的6次方幂的可用空间. 即使我们只想分配一个大小为3的空间,系统却只能返回一个内存大小为 4(2的2次方)的一个空间. 系统在初始化的时候 ,并

看数据结构写代码（43）关节点

首先说明一下概念问题: 关节点 :如果删除无向图中的一个顶点,以及与顶点相关的边,把图的一个连通分量变成两个以上的连通分量.这样的顶点叫做关节点. 没有关节点的无向图,叫做重连通图.重连通图中任意两个顶点至少存在两条以上的通路. 如果删除连通图上的 k个节点,才能破坏他的连通性,那么这个连通图的连通度为k. 下面的算法是求连通图的关节点,并没有考虑求图的关节点,不过要改成图的关节点也不难,只要加一个 for i

看数据结构写代码（40）无向图的深度优先生成树与广度优先生成树

图的深度优先遍历和广度优先遍历算法中的每一次最外层循环都产生一个无向图的连通分量,每一个连通分量,都可以产生一个生成树,将这些生成树合在一起就是一个森林. 用树的孩子兄弟链表表示法来表示这个森林, 就是这一节算法的内容. 深度优先森林代码 : //深度优先生成森林 void dfsTree(AMLGraph g,int i,Tree * t,bool isVisited[]){ isVisited[i] = true; bool i

看数据结构写代码（66）败者树

计算机的内存是有限的,无法存入庞大的数据.当遇到大数据需要排序时,我们需要将这些数据分段从硬盘里读到内存中,排好序,再写入到硬盘中,这些段叫做归并段.最后将这些分段合并成一个最终完整有序的数据. 这里操作的时间 = 内部排序时间 + 外存读写时间 + 内部归并所需时间. 其中外存读写时间最耗时,外存读写时间 = 读写次数 * 读写数据的时间 ,读写数据的时间因设备性能而影响,我们无法控制,我们只能控制

看数据结构写代码（4）单链表

单链表比较简单,中间倒也没出什么大问题,只是在写插入和删除的算法的时候 ,时间复杂度是正常算法的2倍.后来改正了. 下面奉上代码.如有 bug,欢迎指出. // SingleList.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include <cstdlib> enum E_State { E_State_Error = 0, E_State_OK = 1, }; typedef int ElementTyp