1. 界定符 两边加上“/……/” 同时也可以使用“#……#”
2. 原子 可见原子&不可见原子 最小的单位
可见原子:能够用肉眼看见的字符
不可见原子:肉眼看不见的原子,如:\n 换行符 \t 制表符
建议:在关于汉字进行匹配的时候,先去站长工具,把汉字转化成Unicode编码,在进行匹配,可以避免编码不同产生的错误。
3. 元字符
原子的筛选方式
| 匹配两个或多个分支选择。
[.......] 匹配方括号中的任意一个原子
[^.......] 匹配除方括号中的原子之外的任意一个字符,注:[^ 这两个符号必须连在一起。
原子的集合
. 匹配除了换行符之外的任意字符。等价于 [^\n]
\d 匹配一个十进制的数字 [0-9]
\D 匹配一个非十进制数字 [^0-9]
\s 匹配一个不可见的原子 [\t\n\r\f\v]
\S 匹配任何一个可见原子 [^\t\n\r\f\v]
\w 匹配任何一个数字、字母、下划线 [0-9a-zA-Z_]
\W 匹配任何一个非数字、字母、下划线 [^0-9a-zA-Z_]
4. 量词 不但支持原子,还支持原子的集合
{n} 其前面的原子正好出现n次
{n,} 其前面的原子最少出现n次
{n,m} 其前面的原子最少出现n次,最多出现m次
* 匹配0次,1次,多次 {0,}
+ 匹配1次,多次 {1,}
? 匹配0次,1次 {0,1}
5. 边界控制
^ 必须以其后的那一个原子开始
$ 必须以之前的那一个原子结束
() 匹配其中的整体为一个原子
时间: 2024-10-10 22:11:09