正则表达式易于使用而又让人费解,乍一看上去,就像是一行行的乱码,但是它的功能确实又不容小觑。今天整理正则时,纠正了自己的一个误解。
先缕一缕:
正则表达式的两种声明方式:
字面量、构造器
(RegExp构造器适用于必须在运行时动态生成正则表达式的情形,并且还涉及到双重转义的问题,因此优先选择字面量方法声明。)
RegExp实例的两个方法:
exec();//返回一个数组(一个个的捕获组)
test();//返回一个布尔值
exec()涉及到了正则表达式的分组,他有四种分组:捕获型、非捕获型、向前正向匹配、向前负向匹配。
捕获型:括号里的内容被匹配后,会保存在RegExp中,如:
var str = "we are family~~";
var pattern = /(are)/;
pattern.test(str);
alert(RegExp.$1); //输出:are
非捕获型:括号里的内容被匹配后,不会保存在RegExp中,如:
var str = "we are family~~";
var pattern = /(?:are)/;
pattern.test(str);
alert(RegExp.$1); //输出:(空)
问题出现了:我习惯性地在用字面量去声明正则表达式时加上开始和结束控制符“/^&/”,结果并没有输出我想要的结果:
var str = "we are family~~";
var pattern = /^(are)&/;
alert(pattern.test(str)); //输出:false
才发现这个/^$/并非我想想中的那个意思。
我们用^、$去框定(这是《JS语言精粹》里的用词,感觉很贴切)一个正则表达式,它指引正则表达式对文本的所有字符进行匹配,并且匹配那些以特定字符开始和结束的字符串。
“^”:表示一个字符串的开始,将匹配一个以特定字符开头的字符串,如果上例中str的值为“are we family~~",那么alert(pattern.test(str))就会输出true;
“$”:表示一个字符串的结束,将匹配一个以特定字符结束的字符串,如果上例中str的值为“we family are",那么alert(pattern.test(str))就会输出true;
其次,string的实例也有一个match方法与正则的exec方法很类似,他们的本质是相同的,书写上刚好是顺序颠倒了一下:
var str = "we are family~~";
var pattern = /are/;
alert(pattern.exec(str)); //输出数组:are,are
alert(str.match(pattern)); //输出一个数组:are,are,该数组与exec方法调用后返回的数组一样
最后想说,正则的使用一定要细心,这么琐碎的东西拼凑起来,去实现各种功能强大的验证,真是可以将我们开发人员的匠心发挥到极致了,并且不严谨的正则表达式是一个常见的安全漏发源地。