正则表达式小结(Regular Expressions)

(原创文章,谢绝转载~)

日常开发中,常用正则表达式方便的进行匹配、筛选工作。正则的常用内容有:

  • 一般情况下原则:从左至右,越多越好(贪婪)
  • 字符;转义:\ ,如 \*,\d (数字)等
  • 选择,case1|case2|case3,

注意:对于大部分正则引擎,匹配规则是从左至右优先,因而,string|stringlong  会匹配到 stringlong 的 string 部分;

少数  Text-Directed Engine  的匹配规则则是最长优先,此时 string|stringlong  会匹配到 stringlong ;

  • 起始位置:^  ,结束位置: $,  注意^和$并不匹配字符而是匹配位置,例如 d$ 可以匹配到 end 的 d,其中end的d字符的右边位置恰为结束位置。
  • 重复数量:
  1. 精确重复数量,{n},例如: char{3}   匹配 charrr,r 重复3次
  2. 非精确重复数量,
    • 0-1 次: ?  ,例如 char?  匹配char(优先)或cha
    • 1-无穷:+ , 例如 char+   匹配char,charr,charrr,.......其中r至少重复1次
    • 0-无穷:* ,  例如 char*   匹配 cha,char,charr,.......其中r重复0次及以上
    • lazy懒惰模式,在上面三种情况下后面再加?号,  ??, +?, *?  ,在这种情况下,匹配越少越好,

例如 char??  ,本来一个问号是 0-1,再lazy模式,则越少越好,0次,于是char?? 可匹配 cha 而不能匹配 char

再如 char+?  ,本来一个加号是1-无穷,再lazy模式,则越少越好,1次,于是char+? 可匹配 char 而不能匹配 charr ,charrr等

    • possessive占有模式,在上面三种情况下后面再加+号,  ?+, ++, *+  ,在这种情况下,匹配越多越好,且不回溯

例如  char++, 越多越好 ,charrrrr,有多少r匹配到多少,

另一方面,不回溯,是什么含义呢,考虑以下问题:  char++r,   它能否匹配 charrrrr ?答案是 不能。事实上:

cha  r++  r

cha  rrrr  r           看过去好像可以让r++ 匹配4个r,最后一个r匹配r,这样正好匹配上,但因为独占模式是越多越好,所以第5个r 也会被 r++ 匹配到,也就是下图所示:

cha  r++       r

cha  rrrrr               r++ 匹配到 rrrrr, 一旦匹配上则占有,不会再回溯(减少r的数量),因而  char++r  中的最后一个r ,没有东西和它匹配,所以匹配失败。

细思则有:   char++r  无法匹配任何形式。。。

  • 捕获组和索引值(Capturing Groups and Backreferences )

捕获组 用括号括住捕获部分,(regex),例如 (regex1)(regex2){3} ,regex1 和regex2 分别为两个捕获组,且分别具有索引值1和2,

   注意:索引值序列123...的编码顺序为根据括号先从左至右,从外到内递归,

        例如 (str1)(str(str3))(str4), str1索引值为1,(str(str3)) 整体索引值为2,str3 索引值为3,str4 索引值为 4。

时间: 2024-10-25 14:53:13

正则表达式小结(Regular Expressions)的相关文章

python 中 正则表达式(Regular Expressions)学习

刚接触了python中的re模块,由于之前没有对正则表达式进行系统性的学习,学起来很费劲,因此写下这篇博客进行积累和巩固,以备后用. 正则表达式的应用是非常广泛的,不论是在linux中还是在编程中,我们总会遇到正则表达式,借着学习python的机会,也稍微系统的学习一下正则表达式. 自己看了下正则表达式的帮助文档,也在Internet上看了一些相关的资料,网上的资料对这个介绍的还是很多的. 以下为自己的学习经历: '*'  这个符号在通配符中是最经常使用的,我们常常用它来匹配任意的字符,在RE中

Liam的C# 学习历程(五):正则表达式(Regular Expressions)

在这周的C#课堂上,我们学习了一些关于正则表达式的知识,结合老师上课所讲的,我又在网上搜索了一些相关的知识,接下来就让我们来实验一下. 首先我们先来复习一些在Linux课堂上学习过的简单的正则表达式的符号: “ . ” :通配一个单个字符,例如“a."可以在“ab.ac.cd.a1.abc”中通配出:“ab.ac和a1”: “.. ” :  与上一个类似,通配两个任意的字符. “ * ”:通配前一个字符的多次出现,  例如“a*”可以通配出:空.a.aa.aaa等: “{}”:可以通配出前一个字

Using Regular Expressions in Python

1. 反斜杠的困扰(The Backslash) 有时候需要匹配的文本带有'\',如'\python',因为正则表达式有些特殊字符有特殊意义,所以需要前面加上'\'来消除特殊意义,这里匹配的正则表达式是'\\python',这时候如果要编译这个正则表达式需要re.compile('\\\\python'),因为在传递字符串的时候python本身就需要用'\\'来表示'\',也就造成了反斜杠的泛滥. 使用前缀'r'可以解决这个问题:’r'之后的'\'只是这个字符本身而没有特殊意义,比如r'\n'表

Eloquent JavaScript #09# Regular Expressions

索引 Notes js创建正则表达式的两种方式 js正则匹配方式(1) 字符集合 重复匹配 分组(子表达式) js正则匹配方式(2) The Date class 匹配整个字符串 Choice patterns 正则匹配的机制 回溯Backtracking Replace 贪婪匹配Greed 动态构建正则表达式 Search The lastIndex property 遍历匹配项 解析INI文件 国际字符 Excercise Regexp golf Quoting style Numbers

Python re module (regular expressions)

regular expressions (RE) 简介 re模块是python中处理正在表达式的一个模块 1 r"""Support for regular expressions (RE). 2 3 This module provides regular expression matching operations similar to 4 those found in Perl. It supports both 8-bit and Unicode strings; b

[转]8 Regular Expressions You Should Know

Regular expressions are a language of their own. When you learn a new programming language, they're this little sub-language that makes no sense at first glance. Many times you have to read another tutorial, article, or book just to understand the "s

Python正则表达式 re(regular expression)

1. 点. .: 代表一个字符 (这个跟linux的正则表达式是不同的,那里.代表的是后面字符的一次或0次出现) 2. 转义 \\ 或者 r'\': 如 r'python\.org' (对.符号的转义) 3. ^ 非或叫做排除 如[^abc]: 任何以非a,b,c的字符 4. | 选择符 如python|perl (从python和perl选择一个) 也可以: p(ython|erl) 5. ? 可选项 如: r'(http://)?(www\.)?python\.org' (http://和w

C#正则表达式小结

C#正则表达式小结    只能输入数字:"^[0-9]*$".只能输入n位的数字:"^\d{n}$".只能输入至少n位的数字:"^\d{n,}$".只能输入m~n位的数字:."^\d{m,n}$"只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$".只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$".只能输入有1~3位小数的正实数:"^[0-

day4 正则表达式(regular)

正则(regular),要使用正则表达式需要导入Python中的re(regular正则的缩写)模块.正则表达式是对字符串的处理,我们知道,字符串中有时候包含很多我们想要提取的信息,掌握这些处理字符串的方法,能够方便很多我们的操作. 正则表达式(regular),处理字符串的方法.

PCRE Perl Compatible Regular Expressions Learning

catalog 1. PCRE Introduction 2. pcre2api 3. pcre2jit 4. PCRE Programing 1. PCRE Introduction The PCRE library is a set of functions that implement regular expression pattern matching using the same syntax and semantics as Perl 5. PCRE has its own nat