从C++strStr到字符串匹配算法

字符串的匹配先定义两个名词：模式串和文本串。我们的任务就是在文本串中找到模式串第一次出现的位置，如果找到就返回位置的下标，如果没有找到返回-1.其实这就是C++语言里面的一个函数：

extern char *strstr(char *str1, const char *str2);

对于这个函数的解释：

str1: 被查找目标
str2: 要查找对象
返回值：如果str2是str1的子串，则返回str2在str1的首次出现的地址；
		如果str2不是str1的子串，则返回NULL。
例如：
char str[]="1234xyz";
char *str1=strstr(str,"34");
cout << str1 << endl;
显示的是: 34xyz

　　返回值是一个指针，这个指针指向文本串中第一次出现模式串的位置。

字符串查找的暴力算法

先看LeetCode上的一道题目，实现这个函数 int strStr(string haystack, string needle); ，要求返回文本串中出现模式串的下标值。

1.如果模式串为NULL，那么直接返回0.
2.如果模式串的长度大于文本串，那么一定查找不到，返回-1.
3.如果存在的话，查找的范围可以限定在文本串的0~s.size()-p.size();

所以暴力算法的代码实现：

int strStr(string haystack, string needle)
{
	int i = 0;
	//模式串为空
	if(needle.empty())
	{
		return 0;
	}
	//文本串的大小小于模式串
	if(haystack.size() < needle.size())
	{
		return -1;
	}
	//确定查找的范围
	for(i = 0; i <= haystack.size()-needle.size(); ++i)
	{
		int j = 0;
		for(j = 0; j < needle.size(); ++j)
		{
			if(haystack[i+j] != needle[j])
			{
				break;
			}
		}//for
		if(j == needle.size())
		{
			return i;
		}
	}//for
	if(i == haystack.size()-needle.size() + 1)
	{
		return -1;
	}
}

时间： 2024-10-12 10:33:20

从C++strStr到字符串匹配算法的相关文章

28. Implement strStr()(KMP字符串匹配算法)

Implement strStr(). Return the index of the first occurrence of needle in haystack, or -1 if needle is not part of haystack. Example 1: Input: haystack = "hello", needle = "ll" Output: 2 Example 2: Input: haystack = "aaaaa",

4种字符串匹配算法:BS朴素 Rabin-karp 有限自动机 KMP(上)

字符串的匹配的算法一直都是比较基础的算法,我们本科数据结构就学过了严蔚敏的KMP算法.KMP算法应该是最高效的一种算法,但是确实稍微有点难理解.所以打算,开这个博客,一步步的介绍4种匹配的算法.也是<算法导论>上提到的.我会把提到的四种算法全部用c/c++语言实现.提供参考学习.下图的表格,介绍了各个算法的处理时间和匹配时间.希望我写的比较清楚.如果不理解的,或者不对的,欢迎留言. 字符串匹配算法及其处理时间和匹配时间算法预处理时间匹配时间朴素算法 0 O((n-m+1)m) Rabi

KMP字符串匹配算法及next前缀数组的应用

#KMP字符串匹配算法及next前缀数组的应用------ KMP算法通常是我们学习字符串匹配算法时遇见的第一个算法,另外还有Rabin-Karp, Sunday算法等. 相对于其他字符串匹配算法, kmp在字符串中字符重复率低的情况下并不具备优势,那为什么KMP算法会作为经典的教学算法呢? 原因可能是:KMP算法充分利用next前缀数组的信息来优化算法,减小时间复杂度的思路在很多字符串相关问题中能给我们启发. 首先上KMP字符串匹配算法, [leetcode在线测试地址](https://le

字符串匹配算法

字符串匹配问题的形式定义: 文本(Text)是一个长度为 n 的数组 T[1..n]: 模式(Pattern)是一个长度为 m 且 m≤n 的数组 P[1..m]: T 和 P 中的元素都属于有限的字母表 Σ 表: 如果 0≤s≤n-m,并且 T[s+1..s+m] = P[1..m],即对 1≤j≤m,有 T[s+j] = P[j],则说模式 P 在文本 T 中出现且位移为 s,且称 s 是一个有效位移(Valid Shift). 比如上图中,目标是找出所有在文本 T=abcabaabcaba

多模字符串匹配算法之AC自动机—原理与实现

简介: 本文是博主自身对AC自动机的原理的一些理解和看法,主要以举例的方式讲解,同时又配以相应的图片.代码实现部分也予以明确的注释,希望给大家不一样的感受.AC自动机主要用于多模式字符串的匹配,本质上是KMP算法的树形扩展.这篇文章主要介绍AC自动机的工作原理,并在此基础上用Java代码实现一个简易的AC自动机. 欢迎探讨,如有错误敬请指正如需转载,请注明出处 http://www.cnblogs.com/nullzx/ 1. 应用场景-多模字符串匹配我们现在考虑这样一个问题,在一个文本串t

时空权衡之输入增强 ----字符串匹配算法Horspool算法和Boyer-Moore算法

在算法设计的时空权衡设计技术中,对问题的部分或者全部输入做预处理,对获得的额外信息进行存储,以加速后面问题的求解的思想,我们称作输入增强. 其中字符串匹配算法Horspool算法和Boyer-Moore算法就是输入增强的例子. 首先了解一下字符串匹配的概念.我们把在一个较长的n个字符的串中,寻找一个给定的m个字符的串的问题,称为字符串匹配问题.较长的串称为text,而需要寻找的串称为pattern. 字符串匹配问题的蛮力算法很好理解:我们把pattern与text第一个字符对齐,从左往右比较pa

字符串匹配算法KMP算法

数据结构中讲到关于字符串匹配算法时,提到朴素匹配算法,和KMP匹配算法. 朴素匹配算法就是简单的一个一个匹配字符,如果遇到不匹配字符那么就在源字符串中迭代下一个位置一个一个的匹配,这样计算起来会有很多多余的不符合的匹配做了冗余的比较.假设源字符串长n,字串长m 该算法最差时间复杂度为 m*(n-m+1),记为O(n*m);这里不做过多解释朴素匹配算法. KMP算法: kmp算法不是在源字符串中下手,他是从字串下手,比如我要在源字符串(acabaabaabcacaabc)中匹配一个字符串字串(ab

【算法设计与分析基础】19、字符串匹配算法

package cn.xf.algorithm.ch07inputEnhancement; import java.util.HashMap; import java.util.List; import java.util.Map; import org.junit.Test; /** * * 功能:字符串匹配算法,(还有一种叫KMP算法的,也是很经典的算法,就是比较复杂) * * 第一步:对于给定的长度为m的模式和在模式文本中用到的字母表,按照上面的描述构造移动表 * 第二步:将模式与文本的开

蛮力字符串匹配算法

Algorithm: BruteForceStringMatch(T[0..n-1],P[0..m-1]) //该算法实现了蛮力字符串匹配 //输入:一个n个字段的数组T[0..n-1]代表一个文本 //一个m个字段的数组P[0..m-1]代表一个模式 //输出,如果查找成功的话,返回文本的第一个匹配字串中第一个字符的位置,否则返回-1 for i<-0 to n-m do j<-0 while j<m and P[j]=T[i+j] do j<-j+1 if j=m return