正则表达式个人总结(二):正则表达式语法的深入理解第二部分

4.选择与分组

(1).分组

字符组[]:表示匹配若干个字符之一

字符组可以浅显的理解为一些字符的组合,字符组与普通字符的区别在于:abc普通字符表示匹配a接下来b接下来c而字符组[abc]表示在同一位置匹配a或者b或者c;由于字符组本身的含义也决定了可以将这个字符组看成是一个普通的特殊字符。

普通性:普通是因为它也表示在一个位置上匹配一个字符对单个字符的操作在其上面也是可以起作用的;如:[a-z]{6};

特殊性:特殊是因为,1.其他字符在其内外的含义可能不同如:-,.,^等,2.在同一个位置可以有多中选择,但这种选择也只是限于一个字符;

各个字符在字符组内外的区别:

-:在字符组内部,表示一个范围;在字符组外仅仅表示是一个字符;

例子:

-在字符组外

<script type="text/javascript">
  var str = ‘2016-8-20‘;
  var reg = /16-8/g;
  console.log(str.match(reg));  //16-8
  </script>

-在字符组内

<script type="text/javascript">
  var str = ‘2016-8-20‘;
  reg = /1[6-8]/g;
  console.log(str.match(reg));  //16
</script>

-在字符组外是一个普通字符只表示-这个字符本身,所以匹配的是1接下来是6接下来是-接下来是8的这段字符串;所以是16-8

-在字符组内表示的是一个范围,所以匹配的是1接下来是6到8之间的任意数字的字符所以是16;

.:在字符组内部表示一个点;在字符组外部表示任意字符(查找单个字符,除了换行和行结束符)。

.在字符组外

<script type="text/javascript">
	var str = ‘2016-8-20‘;
    var reg = /6.8/g;
    console.log(str.match(reg));  //6-8
  </script>

.在字符组内

<script type="text/javascript">
  var str = ‘2016-8-20‘;
  var reg = /6[.]8/g;
  console.log(str.match(reg));  //null
  </script>

.在字符组外表示任意字符;所以匹配的是6接下来是任意一个字符接下来是8的一个字符串,所以匹配到的是6-8;

.在字符组内只是一个普通字符表示它本身;所以匹配的是6接下来是.接下来是8的一个字符串由于未匹配到所以为null;

对于字符组还可以分为匹配型字符组和排除型字符组主要是因为^的含义的变化

^: 脱字符;

例子:

^在字符组外

  <script type="text/javascript">
   var str = ‘han‘;
   var reg = /^ha/g;
  console.log(str.match(reg)); //ha
  </script>

^在字符组内

 <script type="text/javascript">
   var str = ‘han‘;
   var reg = /[^0-9]/g;
  console.log(str.match(reg)); // h,a,n
  </script>

脱字符在[]外部是一个锚点,表示匹配以某某字符开头的字符或者字符串,在[]中有除了的意思

注意:[^a]表示匹配一个位置不等于a的字符,不要去理解成这个位置不是a就能匹配,后者的理解可以匹配一个空行,注意这个区别

例子:

  <script type="text/javascript">
	var str = ‘han‘;
    var reg = /n[^q]/g;
  console.log(str.match(reg));  //null
  </script>

注意:这个例子在n之后没有任何字符,所以匹配的结果为空,如果按照上述的第二种理解可能就会认为匹配结果是:n

[]中不管有多少字符,在同一个位置只会匹配到其中的任意一个,如果说我要在一个位置上匹配一个字符串那又该如何呢?

(2).选择

此时可以用()加|这个组合,|在正则表达式中是或者的意思,而()在正则表达式中划分一个范围;单独的()使用时没有意义的,只有当它和其他量词共同使用才会体现出它的作用(先说下浅显的例子,贪婪匹配和非贪婪匹配再单独去说,这里先不作说明);

例子:

  <script type="text/javascript">
  var str = ‘2016-8-20‘;
  var reg = /(16-8)/g;
  console.log(str.match(reg));  //16-8
  </script>
<script type="text/javascript">
	var str = ‘2016-8-20‘;
    var reg = /16-8/g;
  console.log(str.match(reg));  //16-8
  </script>

这个例子有没有括号都一样都表示匹配16-8这个字符串

当()和|一起使用则是一种多选结构,可以匹配任意子表达式()表示的是一个范围;|表示的是一个选择方向

例子:

  <script type="text/javascript">
  var str = ‘greygray‘;
  var reg = /gr[ea]y/g;
  console.log(str.match(reg)); // grey,gray
  reg = /gr(e|a)y/g;
  console.log(str.match(reg));  //grey,gray
  </script>

以上这两种匹配的结果都是grey, gray也就是说(|)的分支选择结构在一定程度上是可以和[]进行互相替代

例子:

  <script type="text/javascript">
	var str = ‘greygray‘;
   var reg = /gre|ay|yg/g;
  console.log(str.match(reg)); //gre,yg,ay
  </script>

输出结果:gre,yg,ay

括号的添加与否对结果的影响很大如:

^hello | world | hi :匹配的是 ^hello  或者 world 或者  hi

^(hello | world | hi):.匹配的起始行是 ^hello 或者 ^world 或者  ^ hi

注意:多选结构虽然有时候可以用字符组来表示,他俩之间可以互相表示,但是一个字符组只能匹配目标文本中的单个字符,而每个多选结构自身都可能是完整的正则,都可以匹配任意长度的文本

在正则表达式中需要注意的几点:

1.在正则表达式中,空格字符也被视作一个规则字符;

2.-;.;*等在[]内和[]外的含义并不相同注意区别;注意元字符在字符组内外的区别;

3.当对几个字符添加[]之后该字符串就被视作一个字符组,而对单个字符操作的?*等也可以对其使用,量词之间的混合使用和量词与分组选择之间的混合会有一个贪婪和非贪婪匹配的概念,对此会单独拿出总结;

4.分支结构和字符组的区别;分支可以匹配任意长度的文本;字符组只能匹配一个字符;

5.注意一些概念的理解:比如:[^x]表示‘匹配一个不等于x的字符’而不是’只有当这个位置不是x才能匹配’;[^x]后面的概念可以匹配一个空行在比如{x,y},?,*的理解;

6.在匹配中决定匹配是否成功的是{x,y}中的x,x对匹配成功与否起关键作用。

以上内容纯属个人总结,如有疑问请私信,如需转载请注明出处。

时间: 2024-07-28 18:19:46

正则表达式个人总结(二):正则表达式语法的深入理解第二部分的相关文章

刨根究底正则表达式之二——正则表达式基础

正则表达式基础 一.正则表达式构成 1. 正则表达式中的语法元素,从是否具有特殊含义的角度进行分类,可分为下列两大类.共五种语法元素: 1)不具有特殊含义的语法元素 (1)  字面字符(文本字符):不具有特殊含义的单个字符,代表字符自身(即字符字面值): (2)  普通转义序列:由转义前导符\后跟元字符所组成的字符序列,将具有特殊含义的元字符,转义为(即转换为)不具有特殊含义的字符本身(即字符字面值): 2)具有特殊含义的语法元素 (1)  元字符:具有特殊含义的单个字符,包括:\.(.).[.

Django——正则表达式的举例与基本语法

如果想在URLconf中加入URL和view,只需增加映射URL模式和view功能的Python tuple即可. 这里演示如何添加view中hello功能. from django.conf.urls.defaults import *  from mysite.views import hello   urlpatterns = patterns('',  ('^hello/$', hello), ) Django在检查URL模式前,移除每一个申请的URL开头的斜杠(/). 这意味着我们为/

正则表达式--简单记忆二

全部符号解释 字符 描述 \ 将下一个字符标记为一个特殊字符.或一个原义字符.或一个 向后引用.或一个八进制转义符.例如,'n' 匹配字符 "n".'\n' 匹配一个换行符.序列 '\\' 匹配 "\" 而 "\(" 则匹配 "(". ^ 匹配输入字符串的开始位置.如果设置了 RegExp 对象的 Multiline 属性,^ 也匹配 '\n' 或 '\r' 之后的位置. $ 匹配输入字符串的结束位置.如果设置了RegExp

String类 (二) ~正则表达式

正则表达式 1. 概述 正则表达式本质就是一个 字符串,用于进行数据格式的验证. 通常情况下,正则表达式使用  ^ (异或符号)开头,使用$  (美元符号) 结尾.        可以省略,但是推荐写上 2.常用规则 字符类: [abc]     -表示可以出现a.b 或c中的任意字符 [^abc]   -表示可以出现任意字符,除了a.b 及c [a-zA-Z]  -表示可以出现a到z 和 A到Z之间的任意字符.即可以出现所有的字母. 预定字: \d  -表示可以出现任何数字,相当于[0~9]

JMeter 正则表达式提取器(二)

引用名:  引用此数据-别名 正则表达式:  取值 模板: 表示使用提取到的第几个值:$-1$:表示取所有值$0$:表示随机取值$1$:表示取第1个$2$:表示取第二个以此类推:$n$:表示取第n个 匹配数字(0随机) :0 代表随机取值,1 代表全部取值 缺省值 : 如果正则表达式没有搜找到值,则使用此缺省值 第二接口请求需要参数需要从上个接口获取,获取的是两个参数: 针对一个参数,可以这样取,画红框部分 正则表达式 "token":"(.+?)", ------

Python正则表达式:如何使用正则表达式

正则表达式(简称RE)本质上可以看作一个小的.高度专业化的编程语言,在Python中可以通过re模块使用它.使用正则表达式,你需要为想要匹配的字符串集合指定一套规则,字符串集合可以包含英文句子.e-mail地址.TeX命令或者其它任何你希望的字符串.然后您能提这样的问题:"这个字符串匹配这个模式吗?",或者"在这个字符串中存在这个模式的匹配吗?".你也能使用正则表达式修改一个字符串或者分离它. 正则表达式被编译到一系列的字节码,然后被C语言实现的匹配引擎执行.在一些

Java 正则表达式详解_正则表达式

body{ font-family: "Microsoft YaHei UI","Microsoft YaHei",SimSun,"Segoe UI",Tahoma,Helvetica,Sans-Serif,"Microsoft YaHei", Georgia,Helvetica,Arial,sans-serif,宋体, PMingLiU,serif; font-size: 10.5pt; line-height: 1.5;}

正则表达式基础及常用正则表达式

整数或者小数:^[0-9]+\.{0,1}[0-9]{0,2}$只能输入数字:"^[0-9]*$".只能输入n位的数字:"^\d{n}$".只能输入至少n位的数字:"^\d{n,}$".只能输入m~n位的数字:."^\d{m,n}$"只能输入零和非零开头的数字:"^(0|[1-9][0-9]*)$".只能输入有两位小数的正实数:"^[0-9]+(.[0-9]{2})?$".只能输入有1~

jQuery 入门教程(二): 基本语法

学习jQuery之前需要你有下面几个方面的基本知识 HTML CSS JavaScript jQuery 的基本语法 $(selector).action() $ 符合定义这是一个jQuery语句 (selector) 用来选择某个HTML元素,其语法和CSS的selector语法一样. action() 定义操作该HTML元素的方法. 比如: $(this).hide() – 隐藏当前元素. $("p").hide() – 隐藏所以 <p> 元素. $(".te