学习KMP算法的一点小心得

KMP算法应用于 在一篇有n个字母的文档中 查找某个想要查找的长度为m的单词;
暴力枚举:从文档的前m个字母和单词对比,然后是第2到m+1个,然后是第3到m+2个;这样算法复杂度最坏就达到了O(m*n),对于大数据肯定不行。
KMP算法的精髓即设法减少不必要的枚举次数,举个例子;比如已经匹配好了单词的前k-1个字母;但第k个字母无法匹配了;那么如果前k-1个字母中存在类似回文的情况(前i个字母组成的子串和后i个字母组成的子串相同),那么指针j就变成i(相当于整体往右移动),这样来达到减少枚举次数的目的;因此 可以预先处理 要找的单词,next【i】=t保存单词的前面i-1个字母中,前t个字母组成的子串和后t个字母组成的子串相同; 并且t尽可能大;
如何来求next【i】呢?初始化next【0】=next【1】=0;从前往后递推;令j=next【i-1】;则表示前i-2个字母中前j个字母和后j个字母相同;那么如果s【j】(第j+1个字母)==s【i-1】(第i个字母),next【i】就等于next【j】+1;如果不相等,那么j变成next【j】;
看了2节晚自习才看明白。。确实不大好理解。。。

下面这题是一个很小的应用:(poj2752,yzoi1780)
题目大意:给定一个长度小于400000的字符串s,要求求出所有i;i满足s的前i个字母组成的子串和后i个字母组成的字串相同;
要求将所有i递增输出;
这题只要求出next数组就好;注意要多求一位(算到next【len】位置);j=len;next【j】=t就是s的前t个字母和后t个字母相同;这样就求出了第二大的i(最大的i就是字符串的长度);然后每次循环j=next【j】;next【j】的值就是一个i的值(注意去掉0);

学习KMP算法的一点小心得

时间: 2024-12-04 16:58:57

学习KMP算法的一点小心得的相关文章

一点小心得

项目中会遇到这样的逻辑处理:根据不同类型调用不同的方法,通常会用到if else等语句,感觉不太好: 1,应该面向接口编程 2,尽量避免使用if语句 实例:原来代码,接口Iservice的实现类有 ServiceA ,ServiceB,ServiceC public static void main(String[] args) { String type = "C"; Iservice service = null; if (type.equals("A")) {

ASP.NET MVC Autofac依赖注入的一点小心得(包含特性注入)

前言 IOC的重要性 大家都清楚..便利也都知道..新的ASP.NET Core也大量使用了这种手法.. 一直憋着没写ASP.NET Core的文章..还是怕误导大家.. 今天这篇也不是讲Core的 前面写了C#开发移动应用系列  就第一篇和最后一篇上了最多推荐 - -  也许大家确实不看好吧.. 算了..废话不多说.开始今天的东西吧.. 本篇文章不讲为何我们要用IOC..只讲Autofac使用中的一些小心得 正文 1.基本注入 首先我们要构造一个容器,代码如下: //第一步: 构造一个Auto

学习 KMP 算法

KMP 算法是用来处理字符串匹配问题的.也就是给你两个字符串,你需要回答:B 串是否是 A 串的子串(或 B 串在 A 串中出现的位置).比如,字符串 A = " i am student ", 字符串 B = " student ",我们就说 B 是 A 的子串.我们称待匹配的 A 串为匹配串,用来匹配的 B 串为模式串. 如果使用普通的暴力枚举的算法,遇到个极端的例子,比如 abababababababaab 和 aab,匹配的时间复杂度会高到难以承受,为 O(

卷积学习的一点小心得

在信号的时域分析中,最为重要的就是信号通过线性时不变系统,即时域卷积计算.先来回顾一下线性时不变系统的定义: \[ \begin{array}{l} If{\rm{ }}x(t) \Rightarrow y(t){\rm{ :}}\a{x_1}(t) + b{x_2}(t) \Rightarrow a{y_1}(t) + b{y_2}(t)\x(t - {t_0}) \Rightarrow y(t - {t_0}) \end{array} \tag{1-1} \] 物理可实现的系统绝大多数均满足

用java编网页的学习流程,我的一些小心得(初学java到高深运用)

(1)java基础:首先得会写int,String,for循环,数组,**等等(熟练各种基础的关键字,各种java自带的排序,随即等等算法)什么是封装,继承,多态,然后private,public,protected 是什么区别,什么是静态,什么是重载,什么是重写,然后最重要的是明白什么是对象,并且熟练运用接口.(这是给刚刚接触java的人写的,所以写的详细一点). (2)然后就是搭建小型网站:jsp+servlet+jdbc+mysql+tomcat(jsp是java自带的网页样式,需要把网页

python+tesseract验证码识别的一点小心得

由于公司需要,最近开始学习验证码的识别 我选用的是tesseract-ocr进行识别,据说以前是惠普公司开发的排名前三的,现在开源了.到目前为止已经出到3.0.2了 当然了,前期我们还是需要对验证码进行一些操作,让他对机器更友好,这样才能提高识别率. 步骤基本上是这样的 第一步对验证码进行灰度图以及二值化 需要用到pil库可以pip下载 代码如下 def binarization(image): #转成灰度图 imgry = image.convert('L') #二值化,阈值可以根据情况修改

学习KMP算法

int kmp(char * t,int lenT,char * pat,int lenPat){ int posP=0,posT=0; int[] f=partialMatch(pat,lenPat)//获取pat字符串的部分匹配数组 while(posP<lenPat && posT<lenT){ if(pat[posP]==t[posT]){ posT++; posP++; } else if(posP==0) posT++;//第一就不匹配,目标字符串向后移动 else

软件测试管理的一点小心得

某甲问道:「测试做太多的话,会不会使得bug解不完?」 某乙回答:「还不简单.只要不做测试,就没有bug.」 上述对话,反应出许多软件工作人员对于测试的想法.对多数软件开发人员而言,测试大概是仅次于维护之外,最令人讨厌的工作.对软件研发主管来说,测试是必要之恶:做得不够后患无穷,做得过多又增加成本,延误商机.因此,如何能够规画与执行一个最经济有效的测试工作,当是软件研发主管们须研究的一个课题. 软件测试的困难,在于它不仅是产品的测试,更是产品设计程序的检验.由于关乎设计的测试,准则不易寻找,经验

对liunx系统中用户和权限管理一点小心得

近期才接触Liunx,给我的感觉,并不是很难,但是知识点很多,命令杂,并且附带了茫茫多的选项.接下来我就拿用户和权限管理来举个例子. 一丶用户&组的创建,管理. 用户,顾名思义,就是在系统上的接口进行操作的人. 用户分为:1.管理员(root)2.普通用户(user):系统用户和登录用户 管理员比较好理解,好比说一个国家的国王,拥有对国家最高的指挥权.root在linux系统中就扮演了国王的角色,任何的权限对它来说都形同虚设. 而普通用户,相当于这个国家的公民,必须遵循国家规定的法律. 普通用户