正则表达式的语法太过复杂,先总结常用语法为十四则,如下:
1. \b 元字符,匹配单词的开始与结束
2. . 元字符,匹配除换行符以外的任意字符
3. * 元字符,匹配*之前内容,连续重复使用任意次
4. \d 元字符,匹配任意数字
5. \s 元字符,匹配任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等
6. \w 元字符,匹配字母或数字或下划线或汉字等
7. ^和& 元字符,匹配位置,匹配字符串的开始与结束
8. * 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
9. [ ],匹配[ ]中的任意字符,如[abcd]匹配a,b,c,d中的任意一个
10. [a-z0-9A-Z], [ ]中的-匹配从之前字符到之后
11. {},代表之前字符的匹配数量
12. \W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
13. a.*b 贪婪匹配,匹配符合条件的最大字符串,如aaa_bwewqeb,匹配的不是aaa_b是所有字符
14. a.*?b 懒惰匹配,匹配符合条件的最小字符串,同上