主要正则表达式元字符列表（待完善）

类别	字符	含义
定位符	^	行首(默认)
	$	行尾(默认)
	\b	字边界，是单词和空格之间的位置
	\B	非字边界，除字边界之外的任何位置
限定符	?	重复 [0,1]
	+	重复 [1, +∞]
	*	重复 [0, +∞]
	{n}	重复 n
	{n,}	重复 [n,+∞]
	{n,m}	重复 [n, m]
	(pattern)	将符合表达式pattern描述的若干字符整体视为一个字符进行匹配。注意： ①圆括号将导致相关匹配存储到一个临时缓冲区（创建分组），并从左到右对缓冲区（组）编号，编码范围是[1-99]； ②可使用“\index”访问指定索引的分组。使用该语法访问分组称为后向引用（通过该语法可检索相邻重复打字符串） ③也可对分组进行命名
	(?:pattern)	非获取匹配，将组织创建分组示例，这有利于提高性能。
正向预查	(?=pattern)	先匹配符合pattern的字符组，然后在结果中再检索满足()之前表达式的匹配项。（在任何匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，‘Windows (?=95\|98\|NT\|2000)‘ 能匹配 "Windows 2000" 中的 "Windows" ，但不能匹配 "Windows 3.1" 中的 "Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。）
反向预查	(?!pattern)	类似正向预查，只不过是取反。 (负向预查，在任何不匹配 pattern 的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如‘Windows (?!95\|98\|NT\|2000)‘ 能匹配 "Windows 3.1" 中的 "Windows"，但不能匹配 "Windows 2000" 中的 "Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。)
	[abc]或[a\|b\|c]	可选匹配，将匹配a或b或c, 优先匹配左侧的第一项
	[a-z]	范围匹配
	[^abc]或[^a-Z0-9]	取反，表示匹配abc(数字)之外的任意字符
	\| 或 a\|b	二选一进行匹配
	\index	引用指定索引值的自表达式匹配项（index [0,99]）
	\d	匹配数字。等价于[0-9]
	\D	匹配非数字。等价于[^0-9]
	\w	匹配单词字符(子母、数字、下划线)。等价于[a-Za-z0-9_]
	\W	匹配非单词字符。等价于[^a-Za-z0-9_]
	\s	匹配空白字符。等价于[\n\r\t\v\f]
	\S	匹配非空白字符。等价于[^\n\r\t\v\f]
	.	匹配非换行符之外的任何单字符。等价于[^\n]
空白字符	\n	换行符
	\r	回车符
	\t	水平制表符
	\v	垂直制表符
	\f	换页符
进制

时间： 2024-10-27 09:12:45

主要正则表达式元字符列表（待完善）的相关文章

通配符与正则表达式元字符的理解及grep的实例应用

什么是通配符(glob)? 通配符是Linux shell中用来描述(匹配)不确定字符的特殊符号. 看看具体通配符是如何描述字符? * 代表任意字符任意次数 ? 代表任意单个字符0次或者1次 [] 代表括号中存在的任意单个字符 [!] 代表非括号中存在的任意单个字符 [^] 代表指定范围外的任意单个字符 [a-z] 代表所有单个小写字母 [A-Z] 代表所有单个大写字母

1 ''' 2 常用的正则表达式元字符 3 . 匹配换行符以外的任意单个字符 4 * 匹配位于'*'之前的字符或子模的0次或多次出现 5 + 匹配位于'+'之前的字符或子模式的1次或多次出现 6 - 用在[]之内用来表示范围 7 | 匹配位于'|'之前或之后的字符 8 ^ 匹配行首,匹配以^后面的字符开头的字符串 9 $ 匹配行尾,匹配以$之前的字符结束的字符串 10 ? 匹配位于'?'之前的0个或1个字符.当此字符紧随任何其他限定符(*.+.?.{n}.{n,}.{n,m}之后时,匹配模式是'

Sed 命令详解正则表达式元字符

1.简介 sed是非交互式的编辑器.它不会修改文件,除非使用shell重定向来保存结果.默认情况下,所有的输出行都被打印到屏幕上. sed编辑器逐行处理文件(或输入),并将结果发送到屏幕.具体过程如下:首先sed把当前正在处理的行保存在一个临时缓存区中(也称为模式空间),然后处理临时缓冲区中的行,完成后把该行发送到屏幕上.sed每处理完一行就将其从临时缓冲区删除,然后将下一行读入,进行处理和显示.处理完输入文件的最后一行后,sed便结束运行.sed把每一行都存在临时缓冲区中,对这个副本进行编辑,

shell中正则表达式元字符

'.' 匹配任一字符 '*' 指定*前的字符可以连续重复使用任意次 '^' 字符串开头 '$' 字符串结尾 '.*' 任意数量的字符 '\' 转义字符 '[...]' 匹配任一字符 '[^...]' 不匹配任一字符,取反 '$....$' 标记匹配字符,后续通过转义序列进行引用,例如$grep$.*\1,匹配2个grep中间带有任意数目的字符 '\n' 重复在$...$ 内的第n个模式 x\{m,n\} 区间表达式,匹配x字符出现的次数区间.x\{n

正则表达式——元字符

要想学会正则表达式,理解元字符是一个必须攻克的难关. 不用刻意记 .:匹配任何单个字符. 例如正则表达式"b.g"能匹配如下字符串:"big"."bug"."bg",但是不匹配"buug","b..g"可以匹配"buug". [ ] :匹配括号中的任何一个字符. 例如正则表达式"b[aui]g"匹配bug.big和bag,但是不匹配beg.baug

Python支持的正则表达式元字符和语法

Python支持的正则表达式元字符和语法:

Perl正则表达式元字符

正则表达式元字符(metacharacter)是不代表自身原有含义的字符.它们拥有以某种方式控制搜索模式的特殊能力(例如只在行首或行尾搜索模式,或只在以大写或小写字母开头的行上搜索模式).如果在它们前面加上反斜杠(\),这些元字符就会失去其特殊含义.例如,元字符点号(.)代表任何单个字符,但如果在前面加上反斜杠,它就会退化为一个普通的点号或句号. 如果在元字符前面出现了反斜杠,这些反斜杠就会关闭元字符的特殊含义:但如果在正则表达式中的其他数字或字母之前出现反斜杠的话,这些反斜杠则会拥有

正则表达式--元字符的使用

一.基本简介: 1. 定义:即文本的高级匹配模式,提供搜索,替换等功能.其本质是由一系列字符和特殊符号构成的字串,这个字串即正则表达式. 2. 原理:通过普通字符和有特定含义的字符,来组成字符串,用以描述一定的字符串规则,比如:重复,位置等,来表达某类特定的字符串,进而匹配. 3. 目标熟练掌握正则表达式元字符能够读懂常用正则表达式,编辑简单的正则规则能够熟练使用re模块操作正则表达式二.元字符使用: 1.普通字符: 匹配规则:每个普通字符匹配其对应的字符例子:re.findall('

主要正则表达式元字符列表（待完善）