第10章 正则表达式

假设用户需要在HTML表单中填写姓名、地址、出生日期等。那么在将表单提交到服务器进一步处理前,JavaScript程序会检查表单以确认用户确实输入了信息并且这些信息是符合要求的。

 

一.什么是正则表达式

正则表达式(regular expression)是一个描述字符模式的对象。ECMAScript的RegExp类表示正则表达式,而String和RegExp都定义了使用正则表达式进行强大的模式匹配和文本检索与替换的函数。

正则表达式主要用来验证客户端的输入数据。用户填写完表单单击按钮之后,表单就会被发送到服务器,在服务器端通常会用PHP、ASP.NET等服务器脚本对其进行进一步处理。因为客户端验证,可以节约大量的服务器端的系统资源,并且提供更好的用户体验。

 

二.创建正则表达式

创建正则表达式和创建字符串类似,创建正则表达式提供了两种方法,一种是采用new运算符,另一个是采用字面量方式。

1.两种创建方式

var box = new RegExp(‘box‘);                            //第一个参数字符串

var box = new RegExp(‘box‘, ‘ig‘);                      //第二个参数可选模式修饰符

模式修饰符的可选参数


参 数


含 义


i


忽略大小写


g


全局匹配


m


多行匹配

var box = /box/;                                               //直接用两个反斜杠

var box = /box/ig;                                           //在第二个斜杠后面加上模式修饰符

2.测试正则表达式

RegExp对象包含两个方法:test()和exec(),功能基本相似,用于测试字符串匹配。test()方法在字符串中查找是否存在指定的正则表达式并返回布尔值,如果存在则返回true,不存在则返回false。exec()方法也用于在字符串中查找指定正则表达式,如果exec()方法执行成功,则返回包含该查找字符串的相关信息数组。如果执行失败,则返回null。

RegExp对象的方法


方 法


功 能


test


在字符串中测试模式匹配,返回true或false


exec


在字符串中执行匹配搜索,返回结果数组

/*使用new运算符的test方法示例*/

var pattern = new RegExp(‘box‘, ‘i‘);                   //创建正则模式,不区分大小写

var str = ‘This is a Box!‘;                                          //创建要比对的字符串

alert(pattern.test(str));                                       //通过test()方法验证是否匹配

/*使用字面量方式的test方法示例*/

var pattern = /box/i;                                                 //创建正则模式,不区分大小写

var str = ‘This is a Box!‘;

alert(pattern.test(str));

/*使用一条语句实现正则匹配*/

alert(/box/i.test(‘This is a Box!‘));                      //模式和字符串替换掉了两个变量

/*使用exec返回匹配数组*/

var pattern = /box/i;

var str = ‘This is a Box!‘;

alert(pattern.exec(str));                                    //匹配了返回数组,否则返回null

PS:exec方法还有其他具体应用,我们在获取控制学完后再看。

3.使用字符串的正则表达式方法

除了test()和exec()方法,String对象也提供了4个使用正则表达式的方法。

String对象中的正则表达式方法


方 法


含 义


match(pattern)


返回pattern中的子串或null


replace(pattern, replacement)


用replacement替换pattern


search(pattern)


返回字符串中pattern开始位置


split(pattern)


返回字符串按指定pattern拆分的数组

/*使用match方法获取获取匹配数组*/

var pattern = /box/ig;                                        //全局搜索

var str = ‘This is a Box!,That is a Box too‘;

alert(str.match(pattern));                                          //匹配到两个Box,Box
       alert(str.match(pattern).length);                          //获取数组的长度

/*使用search来查找匹配数据*/

var pattern = /box/ig;

var str = ‘This is a Box!,That is a Box too‘;

alert(str.search(pattern));                                          //查找到返回位置,否则返回-1

PS:因为search方法查找到即返回,也就是说无需g全局

/*使用replace替换匹配到的数据*/

var pattern = /box/ig;

var str = ‘This is a Box!,That is a Box too‘;

alert(str.replace(pattern, ‘Tom‘));                         //将Box替换成了Tom

/*使用split拆分成字符串数组*/

var pattern = / /ig;

var str = ‘This is a Box!,That is a Box too‘;

alert(str.split(pattern));                                      //将空格拆开分组成数组

 

RegExp对象的静态属性


属 性


短 名


含 义


input


$_


当前被匹配的字符串


lastMatch


$&


最后一个匹配字符串


lastParen


$+


最后一对圆括号内的匹配子串


leftContext


$`


最后一次匹配前的子串


multiline


$*


用于指定是否所有的表达式都用于多行的布尔值


rightContext


$‘


在上次匹配之后的子串

 

/*使用静态属性*/

var pattern = /(g)oogle/;

var str = ‘This is google!‘;

pattern.test(str);                                                //执行一下

alert(RegExp.input);                                         //This is google!

alert(RegExp.leftContext);                                //This is

alert(RegExp.rightContext);                             //!

alert(RegExp.lastMatch);                                   //google

alert(RegExp.lastParen);                                          //g

alert(RegExp.multiline);                                          //false

PS:Opera不支持input、lastMatch、lastParen和multiline属性。IE不支持multiline属性。

所有的属性可以使用短名来操作

RegExp.input可以改写成RegExp[‘$_‘],依次类推。但RegExp.input比较特殊,它还可以写成RegExp.$_。

RegExp对象的实例属性


属 性


含 义


global


Boolean值,表示g是否已设置


ignoreCase


Boolean值,表示i是否已设置


lastIndex


整数,代表下次匹配将从哪里字符位置开始


multiline


Boolean值,表示m是否已设置


Source


正则表达式的源字符串形式

 

/*使用实例属性*/

var pattern = /google/ig;

alert(pattern.global);                                         //true,是否全局了

alert(pattern.ignoreCase);                                  //true,是否忽略大小写

alert(pattern.multiline);                                    //false,是否支持换行

alert(pattern.lastIndex);                                    //0,下次的匹配位置

alert(pattern.source);                                         //google,正则表达式的源字符串

var pattern = /google/g;

var str = ‘google google google‘;

pattern.test(str);                                                //google,匹配第一次

alert(pattern.lastIndex);                                    //6,第二次匹配的位

PS:以上基本没什么用。并且lastIndex在获取下次匹配位置上IE和其他浏览器有偏差,主要表现在非全局匹配上。lastIndex还支持手动设置,直接赋值操作。

 

三.获取控制

正则表达式元字符是包含特殊含义的字符。它们有一些特殊功能,可以控制匹配模式的方式。反斜杠后的元字符将失去其特殊含义。

字符类:单个字符和数字


元字符/元符号


匹配情况


.


匹配除换行符外的任意字符


[a-z0-9]


匹配括号中的字符集中的任意字符


[^a-z0-9]


匹配任意不在括号中的字符集中的字符


\d


匹配数字


\D


匹配非数字,同[^0-9]相同


\w


匹配字母和数字及_


\W


匹配非字母和数字及_

字符类:空白字符


元字符/元符号


匹配情况


\0


匹配null字符


\b


匹配空格字符


\f


匹配进纸字符


\n


匹配换行符


\r


匹配回车字符


\t


匹配制表符


\s


匹配空白字符、空格、制表符和换行符


\S


匹配非空白字符

字符类:锚字符


元字符/元符号


匹配情况


^


行首匹配


$


行尾匹配


\A


只有匹配字符串开始处


\b


匹配单词边界,词在[]内时无效


\B


匹配非单词边界


\G


匹配当前搜索的开始位置


\Z


匹配字符串结束处或行尾


\z


只匹配字符串结束处

字符类:重复字符


元字符/元符号


匹配情况


x?


匹配0个或1个x


x*


匹配0个或任意多个x


x+


匹配至少一个x


(xyz)+


匹配至少一个(xyz)


x{m,n}


匹配最少m个、最多n个x

字符类:替代字符


元字符/元符号


匹配情况


this|where|logo


匹配this或where或logo中任意一个

字符类:记录字符


元字符/元符号


匹配情况


(string)


用于反向引用的分组


\1或$1


匹配第一个分组中的内容


\2或$2


匹配第二个分组中的内容


\3或$3


匹配第三个分组中的内容

/*使用点元字符*/

var pattern = /g..gle/;                                        //.匹配一个任意字符

var str = ‘google‘;

alert(pattern.test(str));

/*重复匹配*/

var pattern = /g.*gle/;                                       //.匹配0个一个或多个

var str = ‘google‘;                                              //*,?,+,{n,m}

alert(pattern.test(str));

/*使用字符类匹配*/

var pattern = /g[a-zA-Z_]*gle/;                          //[a-z]*表示任意个a-z中的字符

var str = ‘google‘;

alert(pattern.test(str));

var pattern = /g[^0-9]*gle/;                               //[^0-9]*表示任意个非0-9的字符

var str = ‘google‘;

alert(pattern.test(str));

var pattern = /[a-z][A-Z]+/;                               //[A-Z]+表示A-Z一次或多次

var str = ‘gOOGLE‘;

alert(pattern.test(str));

/*使用元符号匹配*/

var pattern = /g\w*gle/;                                    //\w*匹配任意多个所有字母数字_

var str = ‘google‘;

alert(pattern.test(str));

var pattern = /google\d*/;                                  //\d*匹配任意多个数字

var str = ‘google444‘;

alert(pattern.test(str));

var pattern = /\D{7,}/;                                      //\D{7,}匹配至少7个非数字

var str = ‘google8‘;

alert(pattern.test(str));

/*使用锚元字符匹配*/

var pattern = /^google$/;                                          //^从开头匹配,$从结尾开始匹配

var str = ‘google‘;

alert(pattern.test(str));

var pattern = /goo\sgle/;                                    //\s可以匹配到空格

var str = ‘goo gle‘;

alert(pattern.test(str));

var pattern = /google\b/;                                    //\b可以匹配是否到了边界

var str = ‘google‘;

alert(pattern.test(str));

/*使用或模式匹配*/

var pattern = /google|baidu|bing/;                      //匹配三种其中一种字符串

var str = ‘google‘;

alert(pattern.test(str));

/*使用分组模式匹配*/

var pattern = /(google){4,8}/;                                   //匹配分组里的字符串4-8次

var str = ‘googlegoogle‘;

alert(pattern.test(str));

var pattern = /8(.*)8/;                                       //获取8..8之间的任意字符

var str = ‘This is 8google8‘;

str.match(pattern);

alert(RegExp.$1);                                             //得到第一个分组里的字符串内容

var pattern = /8(.*)8/;

var str = ‘This is 8google8‘;

var result = str.replace(pattern,‘<strong>$1</strong>‘);              //得到替换的字符串输出

document.write(result);

var pattern = /(.*)\s(.*)/;

var str = ‘google baidu‘;

var result = str.replace(pattern, ‘$2 $1‘);                     //将两个分组的值替换输出

document.write(result);


贪 婪


惰 性


+


+?


?


??


*


*?


{n}


{n}?


{n,}


{n,}?


{n,m}


{n,m}?

/*关于贪婪和惰性*/

var pattern = /[a-z]+?/;                                      //?号关闭了贪婪匹配,只替换了第一个

var str = ‘abcdefjhijklmnopqrstuvwxyz‘;

var result = str.replace(pattern, ‘xxx‘);

alert(result);

var pattern = /8(.+?)8/g;                                    //禁止了贪婪,开启的全局

var str = ‘This is 8google8, That is 8google8, There is 8google8‘;

var result = str.replace(pattern,‘<strong>$1</strong>‘);

document.write(result);

var pattern = /8([^8]*)8/g;                                //另一种禁止贪婪

var str = ‘This is 8google8, That is 8google8, There is 8google8‘;

var result = str.replace(pattern,‘<strong>$1</strong>‘);

document.write(result);

 

/*使用exec返回数组*/

var pattern = /^[a-z]+\s[0-9]{4}$/i;

var str = ‘google 2012‘;

alert(pattern.exec(str));                                    //返回整个字符串

var pattern = /^[a-z]+/i;                                    //只匹配字母

var str = ‘google 2012‘;

alert(pattern.exec(str));                                    //返回google

var pattern = /^([a-z]+)\s([0-9]{4})$/i;               //使用分组

var str = ‘google 2012‘;

alert(pattern.exec(str)[0]);                                 //google 2012

alert(pattern.exec(str)[1]);                                 //google

alert(pattern.exec(str)[2]);                                 //2012

/*捕获性分组和非捕获性分组*/

var pattern = /(\d+)([a-z])/;                               //捕获性分组

var str = ‘123abc‘;

alert(pattern.exec(str));

var pattern = /(\d+)(?:[a-z])/;                             //非捕获性分组

var str = ‘123abc‘;

alert(pattern.exec(str));

/*使用分组嵌套*/

var pattern = /(A?(B?(C?)))/;                             //从外往内获取

var str = ‘ABC‘;

alert(pattern.exec(str));

/*使用前瞻捕获*/

var pattern = /(goo(?=gle))/;                             //goo后面必须跟着gle才能捕获

var str = ‘google‘;

alert(pattern.exec(str));

/*使用特殊字符匹配*/

var pattern = /\.\[\/b\]/;                                      //特殊字符,用\符号转义即可

var str = ‘.[/b]‘;

alert(pattern.test(str));

/*使用换行模式*/

var pattern = /^\d+/mg;                                    //启用了换行模式

var str = ‘1.baidu\n2.google\n3.bing‘;

var result = str.replace(pattern, ‘#‘);

alert(result);

四.常用的正则

 

1.检查邮政编码

var pattern = /[1-9][0-9]{5}/;                                   //共6位数字,第一位不能为0

var str = ‘224000‘;

alert(pattern.test(str));

 

2.检查文件压缩包

var pattern = /[\w]+\.zip|rar|gz/;                         //\w表示所有数字和字母加下划线

var str = ‘123.zip‘;                                             //\.表示匹配.,后面是一个选择

alert(pattern.test(str));

3.删除多余空格

var pattern = /\s/g;                                           //g必须全局,才能全部匹配

var str = ‘111 222 333‘;

var result = str.replace(pattern,‘‘);                      //把空格匹配成无空格

alert(result);

4.删除首尾空格

var pattern = /^\s+/;                                                 //强制首

var str = ‘          goo gle            ‘;

var result = str.replace(pattern, ‘‘);

pattern = /\s+$/;                                               //强制尾

result = result.replace(pattern, ‘‘);

alert(‘|‘ + result + ‘|‘);

var pattern = /^\s*(.+?)\s*$/;                             //使用了非贪婪捕获

var str = ‘            google          ‘;

alert(‘|‘ + pattern.exec(str)[1] + ‘|‘);

var pattern = /^\s*(.+?)\s*$/;

var str = ‘            google          ‘;

alert(‘|‘ + str.replace(pattern, ‘$1‘) + ‘|‘);               //使用了分组获取

5.简单的电子邮件验证

var pattern = /^([a-zA-Z0-9_\.\-]+)@([a-zA-Z0-9_\.\-]+)\.([a-zA-Z]{2,4})$/;

var str = ‘[email protected]‘;

alert(pattern.test(str));

var pattern = /^([\w\.\-]+)@([\w\.\-]+)\.([\w]{2,4})$/;

var str = ‘[email protected]‘;

alert(pattern.test(str));

PS:以上是简单电子邮件验证,复杂的要比这个复杂很多,大家可以搜一下。

时间: 2024-11-05 19:05:52

第10章 正则表达式的相关文章

javascript权威指南笔记(第10章 正则表达式的模式匹配)

1.非贪婪的重复:如"??" .   "+?"   . "*?"  ."{1,5}?" 例如: 非贪婪匹配 /a+?/去匹配aaa,尽可能的少匹配,只能匹配到第一个a, /a+/去匹配aaa,匹配到了aaa /a+b/去匹配aabb,匹配到aabb 而使用非贪婪匹配/a+?b/,它会匹配尽可能少的a和一个b,但是匹配到了aabb,因为会寻找正则表达式第一个匹配的位置 2.圆括号的作用 1.将单独的项组合成子表达式 2.完整的模

&lt;&lt;Python基础教程&gt;&gt;学习笔记 | 第10章 | 充电时刻

第10章 | 充电时刻 本章主要介绍模块及其工作机制 ------ 模块 >>> import math >>> math.sin(0) 0.0 模块是程序 一个简单的模块 #hello.py print ("Hello,World!") >>> import hello Traceback (most recent call last): File "<pyshell#56>", line 1, i

第10章 表单元素(中)

第 10章表单元素[中]学习要点:1.type属性总汇2.type属性解析 本章主要探讨 HTML5中表单中 input元素的 type属性,根据不同的值来显示不同的输入框.一.type属性总汇input元素可以用来生成一个供用户输入数据的简单文本框.在默认的情况下,什么样的数据均可以输入.而通过不同的属性值,可以限制输入的内容. 属性名称 说明text 一个单行文本框,默认行为password 隐藏字符的密码框search 搜索框,在某些浏览器键入内容会出现叉标记取消submit.reset.

第10章:awk进阶操作

第10章:awk进阶操作 在第4章:查找与替换简单的讲解了awk的使用,本章介绍详细讲解awk的使用.awk是一个强大的文本分析工具,简单的说awk就是把文件逐行的读入, 以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理.在shell脚本中文本处理功能awk功能其强大. 7.1.awk命令形式 awk命令在shell脚本基本形式通常由四部分组成: [-F|-f|-v] (参数选项).BEGIN语句块(初始化代码块).pattern{commadns}(能够使用模式匹配的通用语句块).E

鸟哥的linux私房菜——第12章 正则表达式与文件格式化处理

12.1什么是正则表达式 正则表达式就是处理字符串的方法,它是以行为单位来进行字符串的处理行为,正则表达式通过一些特殊符号的辅助,可以让用户轻易达到查找.删除.替换某特定字符串的处理程序. vi.grep.awk.sed支持正则表达式,而cp,ls等命令只能使用bash自身的通配符 12.2基础正则表达式 grep高级参数: grep [-A] [-B] [--color=auto]  'string'   filename -A:after的意思,除了列出该行外,后续的n行也列出来 -B:be

[摘录]第10章 培养胜过对手的力量

第五部分 谈判高手 优势秘籍力量.控制和影响,是每个人与别人交往时都会追求这些东西.不是吗?在进行谈判时,那些最有影响力火灾是最有力量的一方往往会在谈判时迫使对手做出更多的让步.如果你甘心让对手来操纵或影响你的话,显然你就很可能得不到自己想要的结果.另一方面,如果你直到哪些因素,能影响你的对手,并知道如何使用一些具体的方法来形成这种影响力,你就可以将形势控制在自己手中.权力本身也可以成为一种非常富有建设性的力量,当我们谈论权力时,我并不是指独裁者们用来祸害平民们的那种权力,我所说的权力实际上是一

10-11-基数排序-内部排序-第10章-《数据结构》课本源码-严蔚敏吴伟民版

课本源码部分 第10章  内部排序 - 基数排序 ——<数据结构>-严蔚敏.吴伟民版        源码使用说明  链接??? <数据结构-C语言版>(严蔚敏,吴伟民版)课本源码+习题集解析使用说明        课本源码合辑  链接??? <数据结构>课本源码合辑        习题集全解析  链接??? <数据结构题集>习题解析合辑        本源码引入的文件  链接? Status.h.Scanf.c        相关测试数据下载  链接? 数据

读《构建之法》第8、9、10章有感

第8章  需求分析 软件需求 用户的需求五花八门,作为一个软件团队要准确而全面地获取这些需求主要有以下四个步骤: 获取和引导需求.这一步骤也被叫做“需求捕捉”.软件团队需要为用户着想,设身处地,为用户引导出需求. 分析和定义需求.从各个方面获取的需求进行规整,定义需求的内涵从各个角度将需求量化. 验证需求.软件团队要跟利益相关者沟通,通过分析报告.技术原型.用户调查或演示等形式向他们验证软件团队对于这些需求的认知. 在软件产品的生命周期中管理需求. 竞争性需求分析的框架:1.N(需求) 2.A(

敏捷软件开发:原则、模式与实践——第10章 LSP:Liskov替换原则

第10章 LSP:Liskov替换原则    Liskov替换原则:子类型(subtype)必须能够替换掉它们的基类型(base type). 10.1 违反LSP的情形 10.1.1 简单例子 对LSP的违反导致了OCP的违反: struct Point { double x, y;} public enum ShapeType { square, circle }; public class Shape { private ShapeType type; public Shape(Shape