正则表达式学习笔记(二)

  • 字符转义

如何在目标字符串里面查找元字符呢?比如”.””*”,如果直接在正则表达式里面直接使用肯定是不行的。

正则表达式这里处理的办法和 一般编程语言处理方式相类似,直接使用\来取消它的元字符地位,于是,可以在元字符里面可以这样使用:”\.”或者”\*”。

  • 查找未被预定义的字符

标题的意思是说,如果想要查找的字符没有相对应的元字符来处理怎么办?在正则表达式里面我们使用中括号[]来处理,你只要在中括号里面列举你想要查找的字符就可以了。例如查找0~9的数字和w字符:

  • 分支条件

首先来看一个例子:

\(?0\d{2}[) -]?\d{8}

上面的(和)也是元字符,这里使用了\转义符,后面跟了?符号,所以表示的查找的就是有括号或者没有括号开头的字符串。分解如下:

\(? 0\d{2}[) -]? \d{8}

可以匹配类似于(010)88886666或022-22334455, 或02912345678等多种字符串。如果你想要查找电话号码的话,那就问题大了,因上面这个表达式还有可能匹配类似于010)12345678或(022-87654321这种字符串。

怎么解决上面的问题呢?

答案当然是给上述的正则表达式使用更加精准的限制条件。这里我们使用分支条件。

所谓分支条件是指:多种规则并列共同构成一个正则表达式,只要字符串匹配符合其中一个规则,就算找到一个字符串,多个规则之间使用|符号来分开。

以上面的例子来说明:\(0\d{2}\)[- ]?\d{8}|0\d{2}[- ]?\d{8}。

在使用分支条件的时候,要注意各个条件之间的顺序,因为正则表达式工作的时候是从左到右来匹配的,如果某个字符串符合第一条规则,就直接跳出了,不会再去管。例如可以比较试下\d{5}-\d{4}|\d{5}和\d{5}|\d{5}-\d{4}的区别。

  • 分组

先来看两个例子:

\d{3}表示数字重复三次。

\w{4}表示匹配4位字符的单词(\w的意义表示0~9,A~Z,a~z等请看前章节)。

现在,提问:要是想指定HG这两个字符重复多次怎么办?或者其他任意指定的字符重复多次怎么办?

正则表达式里面使用 分组 来解决这个问题。

分组,或者叫做子表达式,在正则表达式里面使用小括号来指定,包含在小括号里面的字符就是一个分组,你可以对它们的重复次数做处理。小括号前面说过,也是元字符。

例如,匹配IP地址:

(\d{1,3}\.){3}\d{1,3}

可以这样分解:

(\d{1,3}\.){3} \d{1,3}

小括号里面的意思是1~3位数字外加一个点;小括号后面跟了个{3}表示子表达式必须重复3次。橙色的表示1~3位数字。

  • 反义

前面已经提到了分组这个好东西,用着也还顺手,现在又有新的问题了,万一我想查找a~z,A~Z这52个字符怎么办?难道要将他们全部都写进子表达式么?有没有好的办法呢?这里使用到了反义。

联系前面学过的元字符,反义其实就是把他们的元字符大写。具体如下:


代码


详解


\W


匹配任意不是字母,数字,下划线,汉字等等的字符


\S


匹配任意不是空白符的字符


\D


匹配任意不是数字的字符


\B


匹配任意不是单词开头或者结尾的位置


[^X]


匹配除了X以外的任意字符


[^aieou]


匹配除了aieou几个字母以外的任意字符

例如:\S+表示不包含空白符的字符串(至少有一个字符)。

时间: 2024-08-27 11:20:39

正则表达式学习笔记(二)的相关文章

JavaScript正则表达式学习笔记之一 - 理论基础

自从年前得空写了两篇文章之后就开始忙了,这一忙就是2个月??.当时信誓旦旦说的定期写篇博客的计划也就泡汤了??,不过好在最近有空,顺便总结一下这两个月遇到的几个问题.第一个问题就是项目中用到了一些正则才发现之前被自己忽略的正则是时候补一补了.恰逢今天周六??,就把自己学习JavaScript正则表达式的笔记整理成文,写了这篇关于正则表达式理论基础的文章,希望本文能对有需要的同学提供帮助.号外:本文相对基础,大神请忽略??. 一. 基本概念 正则表达式是用于匹配字符串中字符组合的模式. 一种几乎可

spidering hacks 学习笔记(二)

看过去很乱,学习的记录东西而已,等我读完这本书,就把笔记给整理下!嘿嘿 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74

马哥学习笔记二十八——nginx反向代理,负载均衡,缓存,URL重写及读写分离

Nginx反向代理 Nginx通过proxy模块实现反向代理功能.在作为web反向代理服务器时,nginx负责接收客户请求,并能够根据URI.客户端参数或其它的处理逻辑将用户请求调度至上游服务器上(upstream server).nginx在实现反向代理功能时的最重要指令为proxy_pass,它能够将location定义的某URI代理至指定的上游服务器(组)上.如下面的示例中,location的/uri将被替换为上游服务器上的/newuri. location /uri { proxy_pa

Caliburn.Micro学习笔记(二)----Actions

Caliburn.Micro学习笔记(二)----Actions 上一篇已经简单说了一下引导类和简单的控件绑定 我的上一个例子里的button自动匹配到ViewModel事件你一定感觉很好玩吧 今天说一下它的Actions,看一下Caliburn.Micro给我们提供了多强大的支持 我们还是从做例子开始 demo的源码下载在文章的最后 例子1.无参数方法调用 点击button把textBox输入的文本弹出来 如果textbox里没有文本button不可点,看一下效果图 看一下前台代码 <Stac

2. 蛤蟆Python脚本学习笔记二基本命令畅玩

2. 蛤蟆Python脚本学习笔记二基本命令畅玩 本篇名言:"成功源于发现细节,没有细节就没有机遇,留心细节意味着创造机遇.一件司空见惯的小事或许就可能是打开机遇宝库的钥匙!" 下班回家,咱先来看下一些常用的基本命令. 欢迎转载,转载请标明出处:http://blog.csdn.net/notbaron/article/details/48092873 1.  数字和表达式 看下图1一就能说明很多问题: 加法,整除,浮点除,取模,幂乘方等.是不是很直接也很粗暴. 关于上限,蛤蟆不太清楚

小猪的数据结构学习笔记(二)

小猪的数据结构学习笔记(二) 线性表中的顺序表 本节引言: 在上个章节中,我们对数据结构与算法的相关概念进行了了解,知道数据结构的 逻辑结构与物理结构的区别,算法的特性以及设计要求;还学了如何去衡量一个算法 的好坏,以及时间复杂度的计算!在本节中我们将接触第一个数据结构--线性表; 而线性表有两种表现形式,分别是顺序表和链表;学好这一章很重要,是学习后面的基石; 这一节我们会重点学习下顺序表,在这里给大家一个忠告,学编程切忌眼高手低,看懂不代表自己 写得出来,给出的实现代码,自己要理解思路,自己

JavaScript--基于对象的脚本语言学习笔记(二)

第二部分:DOM编程 1.文档象模型(DOM)提供了访问结构化文档的一种方式,很多语言自己的DOM解析器. DOM解析器就是完成结构化文档和DOM树之间的转换关系. DOM解析器解析结构化文档:将磁盘上的结构化文档转换成内存中的DOM树 从DOM树输出结构化文档:将内存中的DOM树转换成磁盘上的结构化文档 2.DOM模型扩展了HTML元素,为几乎所有的HTML元素都新增了innerHTML属性,该属性代表该元素的"内容",即返回的某个元素的开始标签.结束标签之间的字符串内容(不包含其它

马哥学习笔记二十四——分布式复制快设备drbd

DRBD: 主从 primary: 可执行读.写操作 secondary: 文件系统不能挂载 DRBD: dual primay, 双主(基于集群文件系统的高可用集群) 磁盘调度器:合并读请求,合并写请求: Procotol:drbd数据同步协议 A: Async, 异步  数据发送到本机tcp/ip协议栈 B:semi sync, 半同步  数据发送到对方tcp/ip协议 C:sync, 同步  数据到达对方存储设备 DRBD Source: DRBD资源 资源名称:可以是除了空白字符外的任意

【Unity 3D】学习笔记二十八:unity工具类

unity为开发者提供了很多方便开发的工具,他们都是由系统封装的一些功能和方法.比如说:实现时间的time类,获取随机数的Random.Range( )方法等等. 时间类 time类,主要用来获取当前的系统时间. using UnityEngine; using System.Collections; public class Script_04_13 : MonoBehaviour { void OnGUI() { GUILayout.Label("当前游戏时间:" + Time.t

Spring Batch学习笔记二

此系列博客皆为学习Spring Batch时的一些笔记: Spring Batch的架构 一个Batch Job是指一系列有序的Step的集合,它们作为预定义流程的一部分而被执行: Step代表一个自定义的工作单元,它是Job的主要构件块:每一个Step由三部分组成:ItemReader.ItemProcessor.ItemWriter:这三个部分将执行在每一条被处理的记录上,ItemReader读取每一条记录,然后传递给ItemProcessor处理,最后交给ItemWriter做持久化:It