零宽断言详解

零宽断言的意思是(匹配宽度为零,满足一定的条件/断言) 我也不知道这个词语是那个王八蛋发明的,简直是太拗口了。

零宽断言用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b ^ $ \< \> 这样的锚定作用,用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言。 断言用来声明一个应该为真的事实。正则表达式中只有当断言为真时才会继续进行匹配。

其中零宽断言又分四种:

1)

先行断言   也叫零宽度正预测先行断言(?=exp)   --  表示匹配表达式前面的位置

例如 [a-z]*(?=ing) 可以匹配 cooking 和 singing 中的 cook 与 sing 。

注意:先行断言的执行步骤是这样的先从要匹配的字符串中的最右端找到第一个 ing (也就是先行断言中的表达式)然后 再匹配其前面的表达式,若无法匹配则继续查找第二个 ing 再匹配第二个 ing 前面的字符串,若能匹配则匹配,符合正则的贪婪性。

例如: .*(?=ing) 可以匹配 "cooking singing" 中的 "cooking sing" 而不是 cook

2)

后发断言   也叫零宽度正回顾后发断言(?<=exp)  --  表示匹配表达式后面的位置

例如(?<=abc).* 可以匹配 abcdefg 中的 defg

注意:后发断言跟先行断言恰恰相反 它的执行步骤是这样的:先从要匹配的字符串中的最左端找到第一个abc(也就是先行断言中的表达式)然后 再匹配其后面的表达式,若无法匹配则继续查找第二个 abc 再匹配第二个 abc 后面的字符串,若能匹配则匹配。

例如(?<=abc).* 可以匹配 abcdefgabc 中的 defgabc 而不是 abcdefg

3)

负向零宽断言

负向零宽断言 (?!exp) 也是匹配一个零宽度的位置,不过这个位置的“断言”取表达式的反值,例如 (?!exp) 表示 "exp" 前面的位置,如果 "exp" 不成立 ,匹配这个位置;如果 "exp" 成立,则不匹配。同样,负向零宽断言也有“先行”和“后发”两种,负向零宽后发断言为 (?<!exp)

负向零宽后发断言(?<!exp)

负向零宽先行断言 (?!exp)

负向零宽断言要注意的跟正向的一样。

常用分组语法
分类 代码/语法 说明
捕获 (exp) 匹配exp,并捕获文本到自动命名的组里
(?<name>exp) 匹配exp,并捕获文本到名称为name的组里,也可以写成(?‘name‘exp)
(?:exp) 匹配exp,不捕获匹配的文本,也不给此分组分配组号
零宽断言 (?=exp) 匹配exp前面的位置
(?<=exp) 匹配exp后面的位置
(?!exp) 匹配后面跟的不是exp的位置
(?<!exp) 匹配前面不是exp的位置
注释 (?#comment) 这种类型的分组不对正则表达式的处理产生任何影响,用于提供注释让人阅读

例子:

cat file

aaa bbb CD="123" fd

要取出CD后面的值:

  1. grep -oP ‘(?<=CD=")\d+‘ file

[解析]

以 CD=" 为后发断言,匹配它后面的多个数字。

cat file

Rx Optical Power: -5.01dBm, Tx Optical Power: -2.41dBm

要取出那几个分贝的值:

-5.01

-2.41

  1. grep -oP ‘(?<=: ).*?(?=d)‘ file

[解析]

后发断言 ”: “ 后面的字符串,直到 d 字符前面的字符串,? 号的作用是避免贪婪匹配。

cat file

["check_ssh",ok],["check_eth",ok],["check_disk",ok],["check_swap",ok],["check_mem",ok],["check_hardware",false],["check_filesystem",false],["check_port",ok],["check_redis-server",ok],["check_login",ok]

取出[ ]中含 false 字样的内容:

check_hardware

check_filesystem

  1. grep -Po ‘[^"]+(?=",false)‘  file
时间: 2024-10-10 16:05:17

零宽断言详解的相关文章

JS不支持正则中的负向零宽断言

今天在项目中用到了正则表达式,并且需要用负向零宽断言 (?<=exp) 进行筛选,结果运行时报 Invalid group 错,一开始以为是自己很久没用表达式写错了,查阅了一下正则语法后发现并没有写错. 到网上一搜才发现,JS不支持负向的 (?<=exp) 和 (?<!exp),只支持正向的(?=exp) 和 (?!exp).

Regex 正则零宽断言

http://baike.baidu.com/link?url=sLfovpZmIcS5Uz_tiidXoVtjl30Tu3wARMfhnEcbgEGzsb8g1z7dvtGNXTulu1KDodmiuTAP5ODr_R5D2myeeq 零宽断言 1_1.(?=exp)   零宽度正预测先行断言,它断言自身出现的位置的后面能匹配表达式exp 1_2.(?<=exp) 零宽度正回顾后发断言,它断言自身出现的位置的前面能匹配表达式exp 负向零宽 2_1.(?!exp)零宽度负预测先行断言,断言此位

js正则之零宽断言

我们学到的正则表达式匹配,都是有“宽度”的,使用 \w+. 匹配下面文本,会将 . 一同匹配: regular. expression. 如果不想匹配符号,只匹配一个位置,就要用到“零宽断言”(匹配宽度为零,满足一定的 条件/断言),零宽断言使用 (?=表达式) 的语法,例如 \w+(?=.),其中 (?=.) 表示 . 前面的位置(先行断言) regular. expression. 如果需要匹配后面的位置,如: .regular .expression 则要用到后发断言 (?<=.) ,使用

Java正则零宽断言出现PatternSyntaxException异常

今天在写正则的时候发现Java正则使用零宽断言(?<!exp) 匹配前面不是exp的位置,报出了一个异常: Exception in thread "main" java.util.regex.PatternSyntaxException: Look-behind group does not have an obvious maximum length near index 26 (?<=<img[^>]*src="[^"]*")

老男孩带你了解perl正则表达式中的零宽断言

老男孩IT教育小编为大家整理了perl正则表达式中的零宽断言的方法,希望能帮到大家 1.1 前言 本文只介绍perl语言正则表达式的零宽断言功能. 零宽断言实质:匹配文本里面的位置. 零宽断言叫zero-length assertions,也叫lookaround(这个更容易理解). 包括:lookahead(向前看,零宽度正预测先行断言),lookbehind(向后看,零宽度正回顾后发断言). 从左到右对文本进行匹配,判断是否符合exp表达式. 名字 表达式 如果子表达式成功则- positi

环视-顺序肯定环视-零宽断言-正向预查-反向预查

断言用来声明一个应该为真的事实.正则表达式中,只有当断言为真时才会继续进行匹配.断言匹配的是一个事实,而不是内容.本文介绍四个断言,它们用于查找在某些内容(但并不包括这些内容)之前或之后,也就是一个位置(如\b.^.$)应该满足的一定条件(即断言),因此也称为零宽断言. 顺序肯定环视(?=exp) 零宽度正预测先行断言,又称顺序肯定环视,断言自身出现位置的后面能匹配表达式exp. 比如,匹配以"ing"结尾的单词前面部分(除了"ing"以外的部分(通俗说:首先,要匹

正则表达式的零宽断言

零宽断言,大多地方这样定义它,用于查找在某些内容(但并不包括这些内容)之前或之后的东西,也就是说它们像 \b ^ $ \< > 这样的锚定作用,用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言.我的理解是在一个限定位置的字符串之前或之后进行匹配查找.所以零宽断言,执行过程分两种情况,如果是正向断言,应该是这样的,第一步,判断判断断言是否为真(即是否满足一定条件)第二步,如果满足条件,则进行下一步查找匹配.如果是反向断言,第一步还是按照正则表达式顺序去匹配.第二步

Python-正则零宽断言及命名捕获(类PHP)

(一)零宽断言 说明:本文的例子使用python描述      首先说明一下什么是零宽断言,所谓零宽断言就是并不去真正的匹配字符串文本,而仅仅是匹配对应的位置.      正则表达式中有很多这样的断言,常见的如匹配字符串或者行的起始位置 ^ 和 /A,匹配字符串或者行的末尾 $ 和 /Z,单词边界/B等等.这些简单的就不说了,今天主要说一下界定的使用方法(有些资料叫环式结构,名字而已,不重要).界定也是一种零宽断言,界定主要有四类:      1.前向界定(肯定顺序环视)(?=exp)     

正则表达式 零宽断言 负向零宽断言 平衡组/递归匹配

零宽断言 用于查找在某些内容(但并不包括这些内容)之前或之后的东西,像\b,^,$那样用于指定一个位置,这个位置应该满足一定的条件(即断言),因此它们也被称为零宽断言. (?<=exp)myexp(?=exp1) 负向零宽断言 与零宽断言类似 (?<!exp)myexp(?!exp1) 自己用上面的例子测试下 (?<=<(\w+)>).*(?=<\/\1>) 平衡组/递归匹配 这个看起来有点复杂,其实就是 push/pop. 这里很像编程语言,或者说像个语法分析器