c2java 动态规划之模糊匹配

字符串匹配

精确:

indexOf(String str); -- strstr(), O(mn)。

lastIndexOf(String str); -- continue 的别样用法。

matches(String regex); -- Regex.compile()/match()。

模糊:

java package?

Spell Checker -- 两个字符串的相似程度

Fuzzy Finder -- 子列匹配

上面两个问题都可以用这个概念”编辑距离”来有效解决。

所谓这个距离是指从一个字符串变到另一个字符串所需操作序列的度量;

这些操作包括:替换 shot --> spot, 插入 ago --> agog, 删除 hour --> our。

对于子列匹配,设用户正在输入的s比目标字符串t短,比如Skina是Skienna的子列,

需要两个插入操作,距离为d=2。

问题: |s| + d = |t| 是否表明s是t的子列?

设P(i, j) 表示把s[0..i] 变成t[0..j]的问题,d[i][j]为所需操作的最短距离。

P(i,j)有optimal substructure性质,即子问题P(i-1,j-1), P(i-1,j),

P(i,j-1)构成P(i,j)。证明使用cut-and-paste反证:如果其组成的子问题解

不是最优的,比如d[i-1][j-1], 把它用一个更优的解替换掉,则P(i,j)更小,

与P(i,j)最优矛盾。

带记忆的递归写法的优点是有些子问题不用解。比如背包:

P(i,j) =

P(i-1, j) if j < w[i];

min{P(i-1,j), v[i] + P(i-1,j-w[i])} if j >= w[i]

而当前问题,采用递推写法,优点是可以滚动数组以节省内存。

(i,j) 依赖于(i-1,j-1), (i-1,j), (i,j-1),因此只要按i,j递增的顺序就可以。

滚动数组d[0][] 表示d[i-1][], d[1][] 表示d[i][]。

还有就是处理边界情形(i,0)和(0,j)。

对于子问题(s[0..i], t[0..0]),

d[i][0] = 有三种情形 8(。

这里我们可以很巧妙的处理为:

把s[0]当成空字符\epsilon, 实际比较的字符都在s[1..m]。

则d[i][0] 表示把s[0..i]变成空串t[0..0],显然是把i个字符都删除。

注意上面的索引是虚拟的,实际引用字符时都要减去1。

下面我们假设插入和删除操作度量一样,记为indel()。

c2java 动态规划之模糊匹配,布布扣,bubuko.com

时间: 2024-08-12 21:12:37

c2java 动态规划之模糊匹配的相关文章

利用SQL模糊匹配来验证字段是否是日期格式

最近需要验证数据仓库某个字段是否转化成某种日期格式,比如时间戳格式 '2016-05-03 23:21:35.0', 但是DB2不支持REGEXP_LIKE(匹配)函数,所以需要重新想其他办法. 最后使用了最常规的like来模糊匹配,虽然比不上正则匹配那么精准,但也够用了. 思路: 一个下划线代表一个字符,那'2016-05-03 23:21:35.0'可以表示成'____-__-__-__.__.__.______'. 当然这种办法比较笨,不能识别是数字还是字母还是字符,当然更好的办法是编写U

关键字模糊匹配

关键词模糊匹配,如候选词集合为{‘我爱北京天安门’,‘北京西站’,‘上海外滩’},输入‘北京’,要匹配出{‘我爱北京天安门’,‘北京西站’} 想到了如下几种方法: 1. 正则法 将所有关键词集合存入数组或字典中,然后用关键字进行正则匹配. 效率略慢,400万候选词的话,约用时4s 2.reids法 有两种子方法 keys命令模糊匹配 keys *北京* 官方不推荐这种做法 sscan命令模糊匹配 SSCAN myset 0 MATCH *北京* COUNT 4000000 400万候选词的话,约

Excel 中使用SQL 语句查询数据(七)-----用LIKE 运算符进行模糊匹配查询

这篇博文要和大家分享的是用LIKE 运算符进行模糊匹配查询下图数据源商品代号包含数字的数据. 我们用Microsoft query连接数据源,步骤请参考本系列第一篇博文.语句如下图 其中 LIKE '%[0-9]%' 执行结果如下 然后将结果导入excel  的sheet中

js模糊匹配

<div> <input type="text" placeholder="请输入..." id="input"/><button>搜索</button> <ul id="inputInfo"></ul> </div> let search = [] let list = '' var inputArr = [] document.getEle

selenium模糊匹配控件

起因:在查找一些控件时,可能控件的一些属性是变化的,那在匹配时需要进行模糊匹配,模糊匹配,使用xpath 定位方式有种: contains(属性名,字符串):使用文本匹配,功能很强大 starts-with(属性名,字符串):根据开头进行模糊匹配 ends-with(属性名,字符串):根据结尾内容进行匹配 matchs(属性名,字符串):根据正则进行匹配 案例: 如图,点击底部的一个收藏,弹出OK按钮,需要点击这个Ok,就能正常执行下一步 <span type="1">OK

selenium2 python 学习笔记--xpath模糊匹配

xpath模糊匹配,类似find_by_partial_link,如下图: contains(属性名,字符串),starts-with(属性名,字符串),ends-with(属性名,字符串),matchs(属性名,字符串)

mybatis模糊匹配和正则

模糊匹配 <select id="findByName" parameterType="string" resultType="Student">        select * from student where student.name like "%"#{name}"%";   <select> 正则 <select id="findByName"

Python下用List对员工信息表进行模糊匹配

#需求 用户可以模糊查询员工信息 显示匹配了多少条,匹配字符需要高亮度显示 #脚本内容 #!/usr/bin/env python #_*_ coding:utf-8 _*_ while True:         info = 'info.txt'         f = file(info)         search=raw_input('Please Engter You Search Info: ')         for line in f.readlines():       

C++实现的字符串模糊匹配

C++基本没有正则表达式功能,当然像Boost里提供了正则.本文来源于博客园园友的一篇文章,请看: C/C++ 字符串模糊匹配 很早之前就看过这篇文章,原作者的需求很明确.代码实现也很好. 之所以又写这篇文章,是因为原作者只介绍了在Linux系统下直接调用系统函数fnmatch即可实现,而没有考虑在Windows在的使用. 本人这周看了下Google-glog代码,恰巧发现了一个类似fnmatch的简单实现,因此综合起来提供了一个跨平台的接口. 直接拿原作者的需求为例(再次感谢原作者大熊先生,我