JavaScript 正则表达式详细分析

一 : 语法规则

1.RegExp 构造函数创建了一个正则表达式对象,用于将文本与一个模式匹配

2.RegExp 由两个部分组成

  ①pattern(正则表达式的文本)

  ② flags(

    g:全局匹配;找到所有匹配,而不是在第一个匹配后停止

    i:忽略大小写

    m:多行; 将开始和结束字符(^和$)视为在多行上工作(也就是分别匹配每一行的开始和结束(由 \n 或 \r分割),而不只是只匹配整个输入字符串的最开始和最末尾处。  

    u:Unicode; 将模式视为Unicode序列点的序列

    y:粘性匹配; 仅匹配目标字符串中此正则表达式的lastIndex属性指示的索引(并且不尝试从任何后续的索引匹配)

   )

  eg:/^[a-zA-z]+\.[a-zA-z]+\.(cn|com|info|top)/gi   域名匹配。

二: 创建形式(两种方式)

 1. 字面量  eg:  var a =  /^1\d{2}-\d{4}-\d{4}/g(电话号码匹配)

 2.     构造函数 eg: var a =  new RegExp( /^1\d{2}-\d{4}-\d{4}/g)

三:表达式中特殊字符的含义

字符类别(Character Classes)
字符 含义
.
(点号,小数点) 匹配任意单个字符,但是行结束符除外:\n \r \u2028 或 \u2029

在字符集中,点( . )失去其特殊含义,并匹配一个字面点( . )。

需要注意的是,m 多行(multiline)标志不会改变点号的表现。因此为了匹配多行中的字符集,可使用[^] (当然你不是打算用在旧版本 IE 中),它将会匹配任意字符,包括换行符。

例如,/.y/ 匹配 "yes make my day" 中的 "my" 和 "ay",但是不匹配 "yes"。

\d
匹配任意阿拉伯数字。等价于[0-9]

例如,/\d/ 或 /[0-9]/ 匹配 "B2 is the suite number." 中的 ‘2‘。

\D
匹配任意一个不是阿拉伯数字的字符。等价于[^0-9]

例如,/\D/ 或 /[^0-9]/ 匹配 "B2 is the suite number." 中的 ‘B‘。

\w
匹配任意来自基本拉丁字母表中的字母数字字符,还包括下划线。等价于 [A-Za-z0-9_]

例如,/\w/ 匹配 "apple" 中的 ‘a‘,"$5.28" 中的 ‘5‘ 和 "3D" 中的 ‘3‘。

\W
匹配任意不是基本拉丁字母表中单词(字母数字下划线)字符的字符。等价于 [^A-Za-z0-9_]

例如,/\W/ 或 /[^A-Za-z0-9_]/ 匹配 "50%" 中的 ‘%‘。

\s
匹配一个空白符,包括空格、制表符、换页符、换行符和其他 Unicode 空格。

等价于 [ \f\n\r\t\v?\u00a0\u1680?\u180e\u2000?\u2001\u2002?\u2003\u2004? \u2005\u2006?\u2007\u2008?\u2009\u200a?\u2028\u2029??\u202f\u205f? \u3000]。

例如 /\s\w*/ 匹配 "foo bar" 中的 ‘ bar‘。

\S
匹配一个非空白符。等价于 [^ \f\n\r\t\v?\u00a0\u1680?\u180e\u2000?\u2001\u2002?\u2003\u2004? \u2005\u2006?\u2007\u2008?\u2009\u200a?\u2028\u2029?\u202f\u205f?\u3000]

例如,/\S\w*/ 匹配 "foo bar" 中的 ‘foo‘。

\t 匹配一个水平制表符(tab)
\r 匹配一个回车符(carriage return)
\n 匹配一个换行符(linefeed)
\v 匹配一个垂直制表符(vertical tab)
\f 匹配一个换页符(form-feed)
[\b] 匹配一个退格符(backspace)(不要与 \b 混淆)
\0 匹配一个 NUL 字符。不要在此后面跟小数点。
\cX
X 是 A - Z 的一个字母。匹配字符串中的一个控制字符。

例如,/\cM/ 匹配字符串中的 control-M。

\xhh 匹配编码为 hh (两个十六进制数字)的字符。
\uhhhh 匹配 Unicode 值为 hhhh (四个十六进制数字)的字符。
\
对于那些通常被认为字面意义的字符来说,表示下一个字符具有特殊用处,并且不会被按照字面意义解释。

例如 /b/ 匹配字符 ‘b‘。在 b 前面加上一个反斜杠,即使用 /\b/,则该字符变得特殊,以为这匹配一个单词边界。

对于那些通常特殊对待的字符,表示下一个字符不具有特殊用途,会被按照字面意义解释。

例如,* 是一个特殊字符,表示匹配某个字符 0 或多次,如 /a*/ 意味着 0 或多个 "a"。 为了匹配字面意义上的 * ,在它前面加上一个反斜杠,例如,/a\*/匹配 ‘a*‘。

字符集合(Character Sets)
字符 含义
[xyz]
一个字符集合,也叫字符组。匹配集合中的任意一个字符。你可以使用连字符‘-‘指定一个范围。

例如,[abcd] 等价于 [a-d],匹配"brisket"中的‘b‘和"chop"中的‘c‘。

[^xyz]
一个反义或补充字符集,也叫反义字符组。也就是说,它匹配任意不在括号内的字符。你也可以通过使用连字符 ‘-‘ 指定一个范围内的字符。

例如,[^abc] 等价于 [^a-c]。 第一个匹配的是 "bacon" 中的‘o‘ 和 "chop" 中的 ‘h‘。

边界(Boundaries)
字符 含义
^
匹配输入开始。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符后的开始处。

例如,/^A/ 不匹配 "an A" 中的 "A",但匹配 "An A" 中的 "A"。

$
匹配输入结尾。如果多行(multiline)标志被设为 true,该字符也会匹配一个断行(line break)符的前的结尾处。

例如,/t$/ 不匹配 "eater" 中的 "t",但匹配 "eat" 中的 "t"。

\b
匹配一个零宽单词边界(zero-width word boundary),如一个字母与一个空格之间。 (不要和 [\b] 混淆)

例如,/\bno/ 匹配 "at noon" 中的 "no",/ly\b/ 匹配 "possibly yesterday." 中的 "ly"。

\B
匹配一个零宽非单词边界(zero-width non-word boundary),如两个字母之间或两个空格之间。

例如,/\Bon/ 匹配 "at noon" 中的 "on",/ye\B/ 匹配 "possibly yesterday." 中的 "ye"。

分组(Grouping)与反向引用(back references)
字符 含义
(x)
匹配 x 并且捕获匹配项。 这被称为捕获括号(capturing parentheses)。

例如,/(foo)/ 匹配且捕获 "foo bar." 中的 "foo"。被匹配的子字符串可以在结果数组的元素 [1], ..., [n] 中找到,或在被定义的 RegExp 对象的属性 $1, ..., $9 中找到。

捕获组(Capturing groups)有性能惩罚。如果不需再次访问被匹配的子字符串,最好使用非捕获括号(non-capturing parentheses),见下面。

\n
n 是一个正整数。一个反向引用(back reference),指向正则表达式中第 n 个括号(从左开始数)中匹配的子字符串。

例如,/apple(,)\sorange\1/ 匹配 "apple, orange, cherry, peach." 中的 "apple,orange,"。一个更全面的例子在该表格下面。

(?:x) 匹配 x 不会捕获匹配项。这被称为非捕获括号(non-capturing parentheses)。匹配项不能够从结果数组的元素 [1], ..., [n] 或已被定义的 RegExp 对象的属性 $1, ..., $9 再次访问到。
数量词(Quantifiers)
字符 含义
x*
匹配前面的模式 x 0 或多次。

例如,/bo*/ 匹配 "A ghost booooed" 中的 "boooo","A bird warbled" 中的 "b",但是不匹配 "A goat grunted"。

x+
匹配前面的模式 x 1 或多次。等价于 {1,}

例如,/a+/ 匹配 "candy" 中的 "a","caaaaaaandy" 中所有的 "a"。

x*?

x+?


像上面的 * 和 + 一样匹配前面的模式 x,然而匹配是最小可能匹配。

例如,/".*?"/ 匹配 ‘"foo" "bar"‘ 中的 ‘"foo"‘,而 * 后面没有 ? 时匹配 ‘"foo" "bar"‘。

x?
匹配前面的模式 x 0 或 1 次。

例如,/e?le?/ 匹配 "angel" 中的 "el","angle" 中的 "le"。

如果在数量词 *+? 或 {}, 任意一个后面紧跟该符号(?),会使数量词变为非贪婪( non-greedy) ,即匹配次数最小化。反之,默认情况下,是贪婪的(greedy),即匹配次数最大化。

在使用于向前断言(lookahead assertions)时,见该表格中 (?=)、(?!) 和 (?:) 的说明。

x(?=y) 只有当 x 后面紧跟着 y 时,才匹配 x。 例如,/Jack(?=Sprat)/ 只有在 ‘Jack‘ 后面紧跟着 ‘Sprat‘ 时,才会匹配它。/Jack(?=Sprat|Frost)/ 只有在 ‘Jack‘ 后面紧跟着 ‘Sprat‘ 或 ‘Frost‘ 时,才会匹配它。然而,‘Sprat‘ 或 ‘Frost‘ 都不是匹配结果的一部分。
x(?!y)
只有当 x 后面不是紧跟着 y 时,才匹配 x。例如,/\d+(?!\.)/ 只有当一个数字后面没有紧跟着一个小数点时,才会匹配该数字。

/\d+(?!\.)/.exec("3.141") 匹配 141 而不是 3.141。

x|y
匹配 x 或 y

例如,/green|red/ 匹配 "green apple" 中的 ‘green‘,"red apple." 中的 ‘red‘。

x{n}
n 是一个正整数。前面的模式 x 连续出现 n 次时匹配。

例如,/a{2}/ 不匹配 "candy," 中的 "a",但是匹配 "caandy," 中的两个 "a",且匹配 "caaandy." 中的前两个 "a"。

x{n,}
n 是一个正整数。前面的模式 x 连续出现至少 n 次时匹配。

例如,/a{2,}/ 不匹配 "candy" 中的 "a",但是匹配 "caandy" 和 "caaaaaaandy." 中所有的 "a"。

x{n,m}
n 和 m 为正整数。前面的模式 x 连续出现至少 n 次,至多 m 次时匹配。

例如,/a{1,3}/ 不匹配 "cndy",匹配 "candy," 中的 "a","caandy," 中的两个 "a",匹配 "caaaaaaandy" 中的前面三个 "a"。注意,当匹配 "caaaaaaandy" 时,即使原始字符串拥有更多的 "a",匹配项也是 "aaa"。

断言(Assertions)
字符 含义
x(?=y)
仅匹配被y跟随的x。

举个例子,/Jack(?=Sprat)/,如果"Jack"后面跟着sprat,则匹配之。

/Jack(?=Sprat|Frost)/ ,如果"Jack"后面跟着"Sprat"或者"Frost",则匹配之。但是,"Sprat" 和"Frost" 都不会在匹配结果中出现。

x(?!y)
仅匹配不被y跟随的x。

举个例子,/\d+(?!\.)/ 只会匹配不被点(.)跟随的数字。

/\d+(?!\.)/.exec(‘3.141‘) 匹配"141",而不是"3.141

四 : 正则对象的属性和内置方法

1: 属性

  注意,RegExp 对象的几个属性既有完整的长属性名,也有对应的类 Perl 的短属性名。两个属性都有着同样的值。JavaScript 的正则语法就是基于 Perl 的。

  RegExp.prototype.constructor

  创建该正则对象的构造函数。

  RegExp.prototype.global 

  是否开启全局匹配,也就是匹配目标字符串中所有可能的匹配项,而不是只进行第一次匹配。

  RegExp.prototype.ignoreCase 

  在匹配字符串时是否要忽略字符的大小写。

  RegExp.prototype.lastIndex

  下次匹配开始的字符串索引位置。

  RegExp.prototype.multiline 

  是否开启多行模式匹配(影响 ^ 和 $ 的行为)。

  RegExp.prototype.source 

  正则对象的源模式文本。

  RegExp.prototype.sticky

  是否开启粘滞匹配。

  RegExp.length 

  RegExp.length值为 2。

2: 方法  

  RegExp.prototype.exec()

  在目标字符串中执行一次正则匹配操作。

  RegExp.prototype.test()

  测试当前正则是否能匹配目标字符串。

  RegExp.prototype.toSource() 

  返回一个字符串,其值为该正则对象的字面量形式。覆盖了Object.prototype.toSource 方法.

  RegExp.prototype.toString()

  返回一个字符串,其值为该正则对象的字面量形式。覆盖了

  Object.prototype.toString() 方法。

四 : 正则实例

  1:邮箱匹配:/^([a-zA-Z]|\d)*@[a-zA-Z]+\.[a-zA-Z]+$/gi

  2:手机号码: /^1\d{2}-\d{4}-\d{4}$/g

  3:链接:/^(http|https):\\\\[a-zA-Z]+\.([a-zA-Z]|\d)+\.(cn|com):\d*\\.*$/g

  4:日期格式 :/^\d{4}-\d{1,2}-\d{1,2}$/g

  5:强密码(必须包含大小写字母和数字的组合,不能使用特殊字符,长度在8-10之间):/^(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,10}$/

参考文献:https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/RegExp

时间: 2024-10-03 07:16:03

JavaScript 正则表达式详细分析的相关文章

JavaScript正则表达式知识汇总

Js 正则表达式知识汇总 正则表达式: 1.什么是RegExp?RegExp是正则表达式的缩写.RegExp 对象用于规定在文本中检索的内容. 2.定义RegExp:var +变量名=new RegExp(); 3.RegExp 对象有 3 个方法: 1)test()检索字符串中的指定值,返回值是true或false. var p1=new Reg("e"); document.write(Reg.test("welcome to China!")); 2)exec

javascript内存模型分析猜想

/* * 这里我是利用分析java内存模型的方法来猜想javascript的内存模型, * 由于没有看到国内有关于分析javascript的书籍,但是可以借鉴java的 * 内存模型结构来帮助理解javascript的内存模型中的原型机制,下面先 * 给出一个简单的原型例子 * */ "use strict"; function PrototypeModel(name,author,time){ } PrototypeModel.prototype.name = "Proto

JavaScript正则表达式实例汇总

本文会持续更新 ------------------------------------------------------------------------------------------------------------- 基本语法 关于语法部分就不啰嗦了,全世界都能找到相关知识 详细信息请参阅:W3school参考手册JavaScript RegExp 对象 当然,你也可以参考下面的博客园的他人博客,我就不重复造轮子了:js之正则表达式(上)      JS正则表达式大全(整理详细

javascript正则表达式笔记(转载)

在javascript里面的定义 1.通过RegExp构造函数定义一个正则表达式.第一个参数为正则表达式以字符串传入,第二个参数为修饰符也以字符串传入. 例:var caps = new RegExp("[A-Z]", "g"); 2.直接定义一个正则表达式直接量,表达式右正斜杠符号"/"分隔,后直接跟修饰符.(推荐用这种) 例:var caps = /[A-Z]/g; javascript正则表达式常用的字符 字符 描述 例子 [exp] 对于

JavaScript正则表达式详解(一)正则表达式入门

JavaScript正则表达式是很多JavaScript开发人员比较头疼的事情,也很多人不愿意学习,只是必要的时候上网查一下就可以啦~本文中详细的把JavaScript正则表达式的用法进行了列表,希望对于大家学习JavaScript正则表达式有一定的帮助. 建立正则表达式对象语法 re = new RegExp(/pattern/[flags]) flags 参数说明: g (全文查找出现的所有 pattern) i (忽略大小写) m (多行查找) 普通字符 描述 \ 将下一个字符标记为一个特

JavaScript正则表达式详解(二)JavaScript中正则表达式函数详解

二.JavaScript中正则表达式函数详解(exec, test, match, replace, search, split) 1.使用正则表达式的方法去匹配查找字符串 1.1. exec方法详解 exec方法的返回值 exec方法返回的其实并不是匹配结果字符串,而是一个对象,简单地修改一下execReg函数,来做一个实验就可以印证这一点: function execReg(reg, str) { var result = reg.exec(str); alert(typeof result

LINQ to JavaScript 源码分析

在.net平台工作一年有余,最喜欢的应属Linq特性 在几个移动端web小项目过程中,前端需要对json对象集合进行比较复杂的操作,为提高开发效率,引入了LINQ to Javascript,该项目地址:http://jslinq.codeplex.com/ LINQ to JavaScript代码不到两百行,可读性很好,今天来对它的源代码进行下分析 Linq to JavaScript使用示例 var myList = [ {FirstName:"Chris",LastName:&q

javascript正则表达式修饰符之multiline(/m)的使用

javascript正则表达式有3种修饰符/i./m和/g./i是我们最常用,也是最好理解的,代表正则表达式匹配的时候不区分大小写. var regex = /abc/i; alert(regex.test("aBc"));//true /m代表多行模式multiline,如果目标字符串中不含有换行符\n,即只有一行,那么/m修饰符没有任何意义. var multiline = /abc/m; var singleline = /abc/; //目标字符串不含换行符\n var tar

10.hibernate缓存机制详细分析(转自xiaoluo501395377)

hibernate缓存机制详细分析 在本篇随笔里将会分析一下hibernate的缓存机制,包括一级缓存(session级别).二级缓存(sessionFactory级别)以及查询缓存,当然还要讨论下我们的N+1的问题. 随笔虽长,但我相信看完的朋友绝对能对hibernate的 N+1问题以及缓存有更深的了解. 一.N+1问题 首先我们来探讨一下N+1的问题,我们先通过一个例子来看一下,什么是N+1问题: list()获得对象: 1 /** 2 * 此时会发出一条sql,将30个学生全部查询出来