字符串模式匹配算法之一：朴素模式匹配算法

被搜索的字符串称为主串，待搜索的字符串称为模式串。朴素模式匹配算法的基本思想：

对主串的每一个字符作为子串开头，与模式串进行匹配。对主串做大循环，每个字符开头做模式串长度的小循环，直到匹配成功或全部遍历完成为止。

代码实现非常简单：

    int strStr(char *haystack, char *needle) {
        for (int i = 0; ; ++i)
        {
            for (int j = 0; ; ++j)
            {
                if (!needle[j]) return i;
                if (!haystack[i + j]) return -1;
                if (needle[j] != haystack[i + j]) break;
            }
        }
    }

朴素模式匹配算法时间复杂度分析如下：

情况	时间复杂度	备注
最好情况	O(1)	一开始就匹配成功。
最坏情况	O((n-m+1)*m)	每次不成功的匹配都发生在模式串的最后一个字符。
平均情况	O(n+m)	根据等概率原则，平均是(n+m)/2次查找。

注：其中n为主串长度，m为模式串长度。

时间： 2024-10-12 03:04:01

字符串模式匹配算法之一：朴素模式匹配算法的相关文章

图解字符串的朴素模式匹配算法

复习串的朴素模式匹配算法模式匹配 : 子串定位运算,在主串中找出子串出现的位置. 在串匹配中,将主串 S 称为目标(串),子串 T 称为模式(串).如果在主串 S 中能够找到子串 T, 则称匹配成功,返回第一个和子串 T 中第一个字符相等的字符在主串 S 中的序号,否则,称匹配失败,返回 0. 算法思想: 从主串 S 的第 pos 个字符起和模式 T 的第一个字符比较之,若相同,则两者顺次的去比较后续的每一个字符,否则从主串 S 的下一个字符起再重新和模式 T 的字符比较之.

数据结构——串的朴素模式和KMP匹配算法

一.朴素模式假设我们要从主串S="goodgoogle"中找到子串T="google"的位置,步骤如下: i表示主串的当前位置下标,j表示子串的当前位置下标,如上图在第一轮比较(i=1开始)中j=4和i=4的位置不匹配,接下来就要指针回退,从i=2开始比较,如下: 如此反复直到比较到 i =(主串长度-子串长度+1)的位置或者 j = 子串的长度就退出比较循环,上面的主串和子串在比较到i=5的位置就完全匹配了. #include <stdio.h>

基于KWIC 的关键字匹配算法(管道+过滤器模式下实现)

下面是基于KWIC 的关键字匹配算法(管道+过滤器模式下实现) 关键部分的管道+过滤器软件体系下的实现, 在很多的关键字搜索平台都使用了这一循环移位+排序输出的关键字匹配算法: 具体需求如下: 1.使用管道-过滤器风格: 每个过滤器处理数据,然后将结果送至下一个过滤器,.要有数据传入,过滤器即开始工作.过滤器之间的数据共享被严格限制在管道传输四个过滤器: 输入(Input filter): 从数据源读取输入文件,解析格式,将行写入输出管道移位(CircularShifter filte

详解大端模式和小端模式

详解大端模式和小端模式原文地址:http://blog.csdn.net/ce123_zhouwei/article/details/6971544 一.大端模式和小端模式的起源关于大端小端名词的由来,有一个有趣的故事,来自于Jonathan Swift的<格利佛游记>:Lilliput和Blefuscu这两个强国在过去的36个月中一直在苦战.战争的原因:大家都知道,吃鸡蛋的时候,原始的方法是打破鸡蛋较大的一端,可以那时的皇帝的祖父由于小时侯吃鸡蛋,按这种方法把手指弄破了,因此他的父亲,

大端模式和小端模式的区别

大端模式和小端模式的区别在C语言中除了8位的char型之外,还有16位的short型,32位的long型(要看具体的编译器),对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着如何将多个字节安排的问题.因此就导致了大端存储模式和小端存储模式. 大端模式: 字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中. 小端模式: 与大端存储模式相反,在小端存储模式中,低地址中存放的是字数据的低字节,高地址存放的是字数据的高字节. 例如,16位宽

文档模式与IE浏览器模式

一.IE浏览器的兼容性视图兼容性视图是微软为了兼容基于其它网页标准开发的网站,确保广大互联网用户在浏览网页时不至于受困于网页显示混乱的问题,而专门为IE8增加的一项实用功能.当IE8检测到某网站不兼容时,地址栏右侧就会出现兼容性视图按钮,只需轻轻一点,大部分网页显示就会正常了.(网页会以IE7的代码规范来显示) 它引入重要的两个概念便是“浏览器模式”和“文档模式”: 注:也可按F12进入开发人员工具来查看当前页面的浏览器模式和文档模式二.文档模式指定IE页面排版引擎根据哪一个版本的方式来解

java设计模式 -------- 创建模式之简单工厂模式

本文是自己学习所做笔记,欢迎转载,但请注明出处:http://blog.csdn.net/jesson20121020 工厂模式是最常用的模式,因为工厂模式就相当于创建实例对象的new,我们经常要根据类Class生成实例对象,如A a = new A(),工厂模式也是用来创建用来创建实例对象的,所以以后new时要多个心眼,是否可以考虑使用工厂模式. 简单工厂模式又可以分成三种模式: 1) 普通简单工厂模式 2) 多方法简单工厂模式 3) 多静态方法简单工厂模式普通简单工厂模式: 举例:(简单的

大端模式与小端模式、网络字节顺序与主机字节顺序

大端模式与小端模式一.概念及详解在各种体系的计算机中通常采用的字节存储机制主要有两种: big-endian和little-endian,即大端模式和小端模式. 先回顾两个关键词,MSB和LSB: MSB:Most Significant Bit ------- 最高有效位 LSB:Least Significant Bit ------- 最低有效位大端模式(big-edian) big-endian:MSB存放在最低端的地址上. 举例,双字节数0x1234以big-endia

数据在内存中存储的方式：大端模式与小端模式

什么是大端模式,什么是小端模式? 所谓的大端模式(Big-endian),是指数据的高字节,保存在内存的低地址中,而数据的低字节,保存在内存的高地址中,这样的存储模式有点儿类似于把数据当作字符串顺序处理:地址由小向大增加,而数据从高位往低位放: 所谓小端模式(Little-endian), 是指数据的高字节保存在内存的高地址中,而数据的低字节保存在内在的低地址中,这种存储模式将地址的高低和数据位权有效结合起来,高地址部分权值高,低地址部分权值低,和我们的逻辑方法一致; 为什么有大小端之分: 因