一 : 语法规则
1.RegExp
构造函数创建了一个正则表达式对象,用于将文本与一个模式匹配。
2.RegExp 由两个部分组成
①pattern(正则表达式的文本)
② flags(
g:
全局匹配;找到所有匹配,而不是在第一个匹配后停止
i:
忽略大小写
m:
多行; 将开始和结束字符(^和$)视为在多行上工作(也就是分别匹配每一行的开始和结束(由 \n 或 \r分割),而不只是只匹配整个输入字符串的最开始和最末尾处。
u:Unicode; 将模式视为Unicode序列点的序列
y:
粘性匹配; 仅匹配目标字符串中此正则表达式的lastIndex属性指示的索引(并且不尝试从任何后续的索引匹配)
)
eg:/^[a-zA-z]+\.[a-zA-z]+\.(cn|com|info|top)/gi 域名匹配。
二: 创建形式(两种方式)
1.
字面量 eg: var a = /^1\d{2}-\d{4}-\d{4}/g(电话号码匹配)
2. 构造函数 eg: var a = new RegExp( /^1\d{2}-\d{4}-\d{4}/g)
三:表达式中特殊字符的含义
字符类别(Character Classes) | |
---|---|
字符 | 含义 |
. |
(点号,小数点) 匹配任意单个字符,但是行结束符除外: \n \r \u2028 或 \u2029 。
在字符集中,点( . )失去其特殊含义,并匹配一个字面点( . )。 需要注意的是, 例如, |
\d |
匹配任意阿拉伯数字。等价于 [0-9] 。
例如, |
\D |
匹配任意一个不是阿拉伯数字的字符。等价于 [^0-9] 。
例如, |
\w |
匹配任意来自基本拉丁字母表中的字母数字字符,还包括下划线。等价于 [A-Za-z0-9_] 。
例如, |
\W |
匹配任意不是基本拉丁字母表中单词(字母数字下划线)字符的字符。等价于 [^A-Za-z0-9_] 。
例如, |
\s |
匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格。 等价于 例如 |
\S |
匹配一个非空白符。等价于 。
例如, |
\t |
匹配一个水平制表符(tab) |
\r |
匹配一个回车符(carriage return) |
\n |
匹配一个换行符(linefeed) |
\v |
匹配一个垂直制表符(vertical tab) |
\f |
匹配一个换页符(form-feed) |
[\b] |
匹配一个退格符(backspace)(不要与 \b 混淆) |
\0 |
匹配一个 NUL 字符。不要在此后面跟小数点。 |
\cX |
X 是 A - Z 的一个字母。匹配字符串中的一个控制字符。
例如, |
\xhh |
匹配编码为 hh (两个十六进制数字)的字符。 |
\uhhhh |
匹配 Unicode 值为 hhhh (四个十六进制数字)的字符。 |
\ |
对于那些通常被认为字面意义的字符来说,表示下一个字符具有特殊用处,并且不会被按照字面意义解释。 例如 或 对于那些通常特殊对待的字符,表示下一个字符不具有特殊用途,会被按照字面意义解释。 例如,* 是一个特殊字符,表示匹配某个字符 0 或多次,如 |
字符集合(Character Sets) | |
字符 | 含义 |
[xyz] |
一个字符集合,也叫字符组。匹配集合中的任意一个字符。你可以使用连字符‘-‘指定一个范围。 例如,[abcd] 等价于 [a-d],匹配"brisket"中的‘b‘和"chop"中的‘c‘。 |
[^xyz] |
一个反义或补充字符集,也叫反义字符组。也就是说,它匹配任意不在括号内的字符。你也可以通过使用连字符 ‘-‘ 指定一个范围内的字符。 例如, |
边界(Boundaries) | |
字符 | 含义 |
^ |
匹配输入开始。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。 例如, |
$ |
匹配输入结尾。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。 例如, |
\b |
匹配一个零宽单词边界(zero-width word boundary),如一个字母与一个空格之间。 (不要和 [\b] 混淆)
例如, |
\B |
匹配一个零宽非单词边界(zero-width non-word boundary),如两个字母之间或两个空格之间。 例如, |
分组(Grouping)与反向引用(back references) | |
字符 | 含义 |
(x) |
匹配 x 并且捕获匹配项。 这被称为捕获括号(capturing parentheses)。
例如, 捕获组(Capturing groups)有性能惩罚。如果不需再次访问被匹配的子字符串,最好使用非捕获括号(non-capturing parentheses),见下面。 |
\n |
n 是一个正整数。一个反向引用(back reference),指向正则表达式中第 n 个括号(从左开始数)中匹配的子字符串。
例如, |
(?:x) |
匹配 x 不会捕获匹配项。这被称为非捕获括号(non-capturing parentheses)。匹配项不能够从结果数组的元素 [1], ..., [n] 或已被定义的 RegExp 对象的属性 $1, ..., $9 再次访问到。 |
数量词(Quantifiers) | |
字符 | 含义 |
x* |
匹配前面的模式 x 0 或多次。 例如, |
x+ |
匹配前面的模式 x 1 或多次。等价于 {1,} 。
例如, |
x*?
|
像上面的 * 和 + 一样匹配前面的模式 x,然而匹配是最小可能匹配。 例如, |
x? |
匹配前面的模式 x 0 或 1 次。 例如, 如果在数量词 在使用于向前断言(lookahead assertions)时,见该表格中 |
x(?=y) |
只有当 x 后面紧跟着 y 时,才匹配 x 。 例如,/Jack(?=Sprat)/ 只有在 ‘Jack‘ 后面紧跟着 ‘Sprat‘ 时,才会匹配它。/Jack(?=Sprat|Frost)/ 只有在 ‘Jack‘ 后面紧跟着 ‘Sprat‘ 或 ‘Frost‘ 时,才会匹配它。然而,‘Sprat‘ 或 ‘Frost‘ 都不是匹配结果的一部分。 |
x(?!y) |
只有当 x 后面不是紧跟着 y 时,才匹配 x 。例如,/\d+(?!\.)/ 只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。
|
x|y |
匹配 x 或 y
例如, |
x{n} |
n 是一个正整数。前面的模式 x 连续出现 n 次时匹配。
例如, |
x{n,} |
n 是一个正整数。前面的模式 x 连续出现至少 n 次时匹配。
例如, |
x{n,m} |
n 和 m 为正整数。前面的模式 x 连续出现至少 n 次,至多 m 次时匹配。
例如, |
断言(Assertions) | |
字符 | 含义 |
x(?=y) |
仅匹配被y跟随的x。 举个例子,
|
x(?!y) |
仅匹配不被y跟随的x。 举个例子,
|
四 : 正则对象的属性和内置方法
1: 属性
注意,RegExp
对象的几个属性既有完整的长属性名,也有对应的类 Perl 的短属性名。两个属性都有着同样的值。JavaScript 的正则语法就是基于 Perl 的。
RegExp.prototype.
constructor
创建该正则对象的构造函数。
是否开启全局匹配,也就是匹配目标字符串中所有可能的匹配项,而不是只进行第一次匹配。
在匹配字符串时是否要忽略字符的大小写。
下次匹配开始的字符串索引位置。
是否开启多行模式匹配(影响 ^ 和 $ 的行为)。
正则对象的源模式文本。
是否开启粘滞匹配。
RegExp.length
RegExp.length值为 2。
2: 方法
在目标字符串中执行一次正则匹配操作。
测试当前正则是否能匹配目标字符串。
返回一个字符串,其值为该正则对象的字面量形式。覆盖了Object.prototype.toSource
方法.
返回一个字符串,其值为该正则对象的字面量形式。覆盖了
Object.prototype.toString()
方法。
四 : 正则实例
1:邮箱匹配:/^([a-zA-Z]|\d)*@[a-zA-Z]+\.[a-zA-Z]+$/gi
2:手机号码: /^1\d{2}-\d{4}-\d{4}$/g
3:链接:/^(http|https):\\\\[a-zA-Z]+\.([a-zA-Z]|\d)+\.(cn|com):\d*\\.*$/g
4:日期格式 :/^\d{4}-\d{1,2}-\d{1,2}$/g
5:强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):/^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$/
参考文献:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp