正则表达式元字符简介

要想学会正则表达式,理解元字符是一个必须攻克的难关。不用刻意记

元字符1

.:匹配除\n之外的任何单个字符。

例如正则表达式“b.g”能匹配如下字符串:“big”、“bug”、“b g”,但是不匹配“buug”,“b..g”可以匹配“buug”。

[ ] :匹配括号中的任何一个字符(范围,字符集合)。

例如正则表达式“b[aui]g”匹配bug、big和bag,但是不匹配beg、baug。可以在括号中使用连字符“-”来指定字符的区间来简化表示,例如正则表达式[0-9]可以匹配任何数字字符,这样正则表达式“a[0-9]c”等价于“a[0123456789]c”就可以匹配“a0c”、“a1c”、“a2c”等字符串;还可以制定多个区间,例如“[A-Za-z]”可以匹配任何大小写字母,“[A-Za-z0-9]”可以匹配任何的大小写字母或者数字。思考:x[这里必须是元音]y,如何写正则?【当.出现在[]中,则表示普通.,不作为元字符。】

| :将两个匹配条件进行逻辑“或”运算。

例如‘z|food’ 能匹配 “z” 或 “food”。‘(z|f)ood’ 则匹配 “zood” 或 “food”。 //注意^$问题。

( ) :将 () 之间括起来的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域,这个元字符在字符串提取的时候非常有用。把一些字符表示为一个整体。改变优先级、定义提取组两个作用。

元字符2(限定符)

限定符:限定前面的正则表达式出现的次数。

*:匹配0至多个在它之前的子表达式,和通配符*没关系。等价于{0,}。

例如正则表达式“zo*”(等同于z(o)*)能匹配 “z” 、“zo”以及 “zoo”;因此“.*”意味着能够匹配任意字符串。"z(b|c)*"→zb、zbc、zcb、zccc、zbbbccc。"z(ab)*"能匹配z、zab、zabab(用括号改变优先级)。

+ :匹配前面的子表达式一次或多次,等价于{1,}

例如正则表达式9+匹配9、99、999等。 “zo+”能匹配 “zo”以及 “zoo” ,不能匹配"z"。

? :匹配前面的子表达式零次或一次。等价于:{0,1}

例如,“do(es)?” 可以匹配 “do” 或 “does” 。【colou?r、favou?r】一般用来匹配“可选部分”。(终止贪婪模式)

{n} :匹配确定的 n 次。“zo{2}”→zoo。

例如,“e{2}” 不能匹配“bed”中的“e”,但是能匹配“seed”中的两个“e”。 //seeeed,不可以。

{n,} :至少匹配n次。

例如,“e{2,}”不能匹配“bed”中的“e”(只出现一次,至少两次),但能匹配 “seeeeeeeed”中的所有“e”。

{n,m} :最少匹配 n 次且最多匹配 m 次。

例如“e{1,3}”将匹配“seeeeeeeed”中的前三个“e”。 {2,5}//bed,seed,seeed;beeeeed错误。

元字符3

^(shift+6) :匹配一行的开始。

例如正则表达式“^regex”能够匹配字符串“regex我会用”的开始,但是不能匹配“我会用regex”。^另外一种意思:非!([^0-9])

l$ :匹配行结束符。

例如正则表达式“浮云$” 能够匹配字符串“一切都是浮云”的末尾,但是不能匹配字符串“浮云呀”

时间: 2024-10-12 05:08:58

正则表达式元字符简介的相关文章

Sed 命令详解 正则表达式元字符

1.简介 sed是非交互式的编辑器.它不会修改文件,除非使用shell重定向来保存结果.默认情况下,所有的输出行都被打印到屏幕上. sed编辑器逐行处理文件(或输入),并将结果发送到屏幕.具体过程如下:首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的行,完成后把该行发送到屏幕上.sed每处理完一行就将其从临时缓冲区删除,然后将下一行读入,进行处理和显示.处理完输入文件的最后一行后,sed便结束运行.sed把每一行都存在临时缓冲区中,对这个副本进行编辑,

正则表达式--元字符的使用

一.基本简介: 1. 定义:即文本的高级匹配模式,提供搜索,替换等功能.其本质是由一系列字符和特殊符号构成的字串,这个字串即正则表达式. 2. 原理:通过普通字符和有特定含义的字符,来组成字符串,用以描述一定的字符串规则,比如:重复,位置等,来表达某类特定的字符串,进而匹配. 3. 目标 熟练掌握正则表达式元字符 能够读懂常用正则表达式,编辑简单的正则规则 能够熟练使用re模块操作正则表达式 二.元字符使用: 1.普通字符: 匹配规则:每个普通字符匹配其对应的字符 例子:re.findall('

通配符与正则表达式元字符的理解及grep的实例应用

什么是通配符(glob)?     通配符是Linux shell中用来描述(匹配)不确定字符的特殊符号. 看看具体通配符是如何描述字符?     *       代表任意字符任意次数     ?       代表任意单个字符0次或者1次     []      代表括号中存在的任意单个字符     [!]     代表非括号中存在的任意单个字符     [^]     代表指定范围外的任意单个字符     [a-z]   代表所有单个小写字母     [A-Z]   代表所有单个大写字母   

python正则表达式元字符

python正则表达式元字符,布布扣,bubuko.com

Python_正则表达式元字符

1 ''' 2 常用的正则表达式元字符 3 . 匹配换行符以外的任意单个字符 4 * 匹配位于'*'之前的字符或子模的0次或多次出现 5 + 匹配位于'+'之前的字符或子模式的1次或多次出现 6 - 用在[]之内用来表示范围 7 | 匹配位于'|'之前或之后的字符 8 ^ 匹配行首,匹配以^后面的字符开头的字符串 9 $ 匹配行尾,匹配以$之前的字符结束的字符串 10 ? 匹配位于'?'之前的0个或1个字符.当此字符紧随任何其他限定符(*.+.?.{n}.{n,}.{n,m}之后时,匹配模式是'

shell中正则表达式元字符

'.'    匹配任一字符 '*'   指定*前的字符可以连续重复使用任意次 '^'   字符串开头 '$'   字符串结尾 '.*'   任意数量的字符 '\'     转义字符 '[...]' 匹配任一字符 '[^...]' 不匹配任一字符,取反 '\(....\)'  标记匹配字符,后续通过转义序列进行引用,例如\(grep\).*\1,匹配2个grep中间带有任意数目的字符 '\n'  重复在\(...\) 内的第n个模式 x\{m,n\} 区间表达式,匹配x字符出现的次数区间.x\{n

正则表达式——元字符

要想学会正则表达式,理解元字符是一个必须攻克的难关. 不用刻意记 .:匹配任何单个字符. 例如正则表达式"b.g"能匹配如下字符串:"big"."bug"."bg",但是不匹配"buug","b..g"可以匹配"buug". [ ] :匹配括号中的任何一个字符. 例如正则表达式"b[aui]g"匹配bug.big和bag,但是不匹配beg.baug

Python支持的正则表达式元字符和语法

Python支持的正则表达式元字符和语法:

Perl正则表达式元字符

正则表达式元字符(metacharacter)是不代表自身原有含义的字符.它们拥有 以某种方式控制搜索模式的特殊能力(例如只在行首或行尾搜索模式,或只在以 大写或小写字母开头的行上搜索模式).如果在它们前面加上反斜杠(\),这 些元字符就会失去其特殊含义.例如,元字符点号(.)代表任何单个字符,但 如果在前面加上反斜杠,它就会退化为一个普通的点号或句号. 如果在元字符前面出现了反斜杠,这些反斜杠就会关闭元字符的特殊含义:但如 果在正则表达式中的其他数字或字母之前出现反斜杠的话,这些反斜杠则会拥有